So verwenden Sie reguläre Ausdrücke in der Toolbox

Veröffentlicht: 2022-04-17
Inhalt
Inhalt

Was ist ein regulärer Ausdruck?

Ein regulärer Ausdruck wird verwendet, um ein Muster zu überprüfen oder zu verifizieren. Ihre Hauptanwendung ist das Filtern von Elementen und das Finden von Übereinstimmungen, beispielsweise in den folgenden Szenarien:

  • Analytik: Sie könnten Regex verwenden, um den Datenverkehr zu segmentieren.
  • Htaccess: Sie könnten URLs effizienter umschreiben.
  • SISTRIX: Sie können unsere Berichte nach URLs, Snippets oder Schlüsselwörtern filtern.

Reguläre Ausdrücke – oder Regex – können in vielen Programmiersprachen verwendet werden, aber dieses Tutorial basiert auf Perl, da es den Standard verwendet, auf dem die bereits verfügbare SISTRIX Regex-Funktionalität basiert.

Wie können wir reguläre Ausdrücke erstellen?

Wir werden dies tun, indem wir Zeichen, Gruppierungen, Quantifizierer und Klassen verwenden, da dies die Syntax ist, mit der wir Ausdrücke erstellen können.

Syntax zum Erstellen eines regulären Ausdrucks
Figuren Verhalten Beispiel
? Sucht 1- oder 0-mal nach dem vorhergehenden Zeichen. https?
* Sucht 0 oder öfter nach dem vorhergehenden Zeichen. 30*
+ Sucht mindestens einmal nach dem vorhergehenden Zeichen. [0-9]+
| Sucht nach dem einen oder anderen Element. (oder) (jpg|jpeg)
^ Zeigt den Beginn des Musters an ^https
$ Zeigt das Ende des Musters an html$
· Sucht nach einem beliebigen Zeichen (Platzhalter) 4..
\ Interpretiert kein Sonderzeichen (Zeichen überspringen) \/
Gruppierungsoptionen für reguläre Ausdrücke
Gruppierung Verhalten Beispiel
() Erfasst bestimmte Inhalte (Sistrix)
Entspricht Sistrix
[] Erfasst Zeichen innerhalb der Klammern [0-9]
Entspricht einem beliebigen numerischen Zeichen
[az]
Entspricht jedem Kleinbuchstaben
{} Gibt die Anzahl der Iterationen an, Minimum oder Maximum .{1,3} Übereinstimmungen mit einem beliebigen Zeichen, das zwischen 1 und 3 Mal wiederholt wird.

In diesem Tutorial werden wir keine Quantifizierer verwenden, aber wir denken, dass es trotzdem interessant für Sie ist, sich mit ihnen vertraut zu machen, falls Sie sie in anderen Umgebungen verwenden.

Quantifizierer in regulären Ausdrücken
Quantifizierer Verhalten
\w Sucht nach einem Wort, einer Ziffer oder einem Zeichentyp _
\d Sucht nach einer Ziffer
\s Sucht nach einem Leerzeichen
\b Entspricht dem Anfang oder Ende eines Wortes
\W Sucht nach einem Zeichen, das kein Wort, keine Ziffer oder _ ist
\D Sucht nach einem Zeichen, das keine Ziffer ist
\S Sucht nach einem Zeichen, das kein Leerzeichen ist.

SEO-Beispiele mit regulären Ausdrücken

Um die vorgeschlagenen Beispiele verwenden zu können, müssen Sie zum Abschnitt „Schlüsselwörter“ gehen und Schlüsselwort-, URL-, Titel- oder Beschreibungsfilter verwenden.

Filtern von Schlüsselwörtern mit regulären Ausdrücken

Um auf diese Funktion zuzugreifen, müssen Sie nur eine Domain analysieren 1 und zu Schlüsselwörtern 2 und dann zur Filterauswahl 3 gehen

1
2
3

Verwenden Sie dann den Schlüsselwortfilter mit Regex 4 .

4

Nun möchten wir Ihnen mehrere Anwendungsfälle vorschlagen, in denen Sie diese Ausdrücke anwenden können, um das Beste aus der Keyword-Analyse Ihrer Projekte oder der Analyse Ihrer Mitbewerber herauszuholen.

Markennamen einschließen oder ausschließen

Stellen Sie sich vor, Sie haben eine Marke, die verschiedene Schreibweisen akzeptiert oder unter mehreren verschiedenen Markennamen bekannt ist. Wir können einen regulären Ausdruck erstellen, um alle Keywords zu gruppieren, die wir als Markenbegriffe betrachten. Zum Beispiel hat currys.co.uk verschiedene Marken-Keywords, nämlich:

Curry, Currys, PC-Welt

Daher verwenden wir den folgenden Ausdruck:

 (curry|currys|pc world).*
Keyword-Tabelle in der SISTRIX Toolbox für currys.co.uk mit angewendetem Regex-Filter ".*(curry|currys|pc world).*".

Unten sehen Sie die Ergebnisse, die wir erhalten würden:

Es ist auch möglich, den Filter so einzustellen, dass Marken-Keywords ausgeschlossen werden, indem der folgende Ausdruck verwendet wird, und es werden nur generische Keywords angezeigt:

 ^(?!.*(curry|currys|pc world).*?)
Keyword-Tabelle in der SISTRIX Toolbox für currys.co.uk mit angewendetem Regex-Filter ".^(?!.*(curry|currys|pc world).*?)".

Schließen Sie Fehler in Markenbegriffen ein oder aus

Es besteht die Möglichkeit, dass wir auf Marken stoßen, die oft falsch geschrieben oder mit Fehlern geschrieben sind, wie z. B. Ryanair.

Hier sind einige Beispiele für Begriffe, die Benutzer eingeben, um nach dieser Fluggesellschaft zu suchen:

  • Ryanair
  • Rayaner
  • Ryan ir
  • rayan ir
  • rayana eir
  • raya nair
  • rayan ari
  • Rayar-Luft

Wir haben über 35 Markennamen identifiziert, die wir mit nur einem einzigen regulären Ausdruck erfassen können:

So schließen Sie alle Markenvarianten ein:

 (r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?
Keyword-Tabelle in der SISTRIX Toolbox für ryanair.com mit dem Regex-Filter ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| Linien| )?(Linie|ir)?" angewandt.

So schließen Sie alle Markenvarianten aus:

 ^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$
Keyword-Tabelle in der SISTRIX Toolbox für ryanair.com mit dem Regex-Filter "^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air) ?(e|lines| )?(line|ir)?).)*$" angewendet.

Natürlich können wir noch andere Filter auf diese Liste anwenden, wie „enthält“, „enthält nicht“, „endet mit“ oder „beginnt mit“.

Schließen Sie Keyword-Begriffe ein oder aus, die mit bestimmten Wörtern enden

Um nach einem eindeutigen Schlüsselwort zu suchen, reicht ein einfacher Filter aus, aber wenn wir eine Suche mit mehreren Bedingungen durchführen möchten, zum Beispiel: alle Schlüsselwörter, die mit „kaufen“ beginnen und mit „online“ enden, können wir verwenden:

 ^buy.*online$

Dies würde, angewendet auf einen Online-Shop wie screwfix.com, die folgenden Ergebnisse zurückgeben:

Keyword-Tabelle in der SISTRIX Toolbox für currys.co.uk mit angewendetem Regex-Filter „^buy.*online$“.

Schließen Sie Keyword-Begriffe ein oder aus, die mit bestimmten Wörtern beginnen

Aus Sicht eines Vergleichstools kann es interessant sein, Keywords filtern zu können, die verschiedene Markennamen enthalten.

Zum Beispiel können wir einen regulären Ausdruck erstellen, der Begriffe basierend auf den gewünschten Kriterien gruppiert, was in diesem Fall jeder Schlüsselwortbegriff ist, der mit einem Markennamen beginnt, der in Klammern steht:

 ^(sony|panasonic|philips|samsung).*

Ebenso können wir sie verwenden, um sie auszuschließen:

 ^(?!(sony|panasonic|philips|samsung).*)

Schließen Sie Keyword-Begriffe ein oder aus, die sich auf bestimmte Attribute beziehen

Versuchen wir dies anhand eines Beispiels für ein Attribut, das häufig in vielen Projekten vorkommt: Preis.

Es gibt viele Suchanfragen, die auf den Preis anspielen, wie zum Beispiel: „günstig“, „Rabatt“, „Outlet“, „Gutschein“, „Angebot“, „günstig“, „Budget“ usw.

Wenn wir sie aus den Ergebnissen ausschließen möchten, können wir den folgenden Ausdruck verwenden:

 .*(cheap|budget|offer|outlet|price).*
Keyword-Tabelle in der SISTRIX Toolbox für skinflint.co.uk mit angewendetem Regex-Filter „.*(cheap|budget|offer|outlet|price).*“.

Unter Verwendung der dynamischen Spalten der Tabelle können wir die Daten nach Suchvolumen in absteigender Reihenfolge organisieren, indem wir einfach auf die Kopfzeile der Spalte klicken.

In anderen Fällen können wir auch andere Attribute wie Farben, Formen, Größen, Ziel usw. verwenden.

Keyword-Begriffe einschließen oder ausschließen, die den Namen von Städten im Vereinigten Königreich enthalten

Viele Projekte erfordern eine lokale Präsenzverfolgung. Dazu können wir Regex verwenden, um Provinzen, Regionen, Städte, Gemeinden usw. zu gruppieren.

In diesem Beispiel verwenden wir die Liste der Städte, um einen regulären Ausdruck zu erstellen, der Keyword-Begriffe filtert, die eine Stadt enthalten.

 .*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*

Jedes E-Commerce-Unternehmen oder Vergleichstool mit physischer Präsenz kann diesen Ausdruck verwenden, um Städte auszuschließen und sogar Marken-Keywords hinzuzufügen oder andere Parameter auszuschließen.

 ^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))

Wir können sie jedoch auch in mehrere Ausdrücke aufteilen, wie unten gezeigt:

Filterergebnisfeld für die Keyword-Tabelle der SISTRIX Toolbox. Der Filter wird auf „Keyword“ und dann auf „Regulärer Ausdruck“ gesetzt. Der eingegebene Regex lautet "^(?!.*(nike|jordan|air|niketown).*?)".

Von hier an fügen wir den Expertenfilter hinzu, um anzuzeigen, dass diese beiden Ausdrücke vom Typ „und“ statt vom Typ „oder“ sind.

Tabellenoptionen für die Stichworttabelle. Sie finden sie in der oberen Navigation neben „Datum“. Die Option „Expertenfilter“ ist ausgewählt.
Keyword-Tabelle in der SISTRIX Toolbox für nike.com mit aktivierten Expertenfiltern. Hier sind zwei Regex-Filter, die durch das boolesche UND kombiniert werden.

URLs mit regulären Ausdrücken filtern

Die Schritte, die Sie befolgen müssen, um URLs zu filtern, sind die gleichen wie die, die wir für Schlüsselwörter untersucht haben, der einzige Unterschied besteht darin, dass Sie „URLs“ und dann reguläre Ausdrücke auswählen müssten.

Filterergebnisfeld für die Keyword-Tabelle der SISTRIX Toolbox. Der Filter wird auf „URL“ und dann auf „Regulärer Ausdruck“ gesetzt.

Unterdomänen einschließen oder ausschließen

Nachdem wir nun gelernt haben, wie man reguläre Ausdrücke zum Filtern von Schlüsselwörtern verwendet, wollen wir einige typische SEO-Anwendungsfälle finden, in denen wir URLs filtern müssten.

Hier sind einige grundlegende Anwendungsfälle für die Analyse einer gesamten Domain und die Gruppierung von URLs nach strategischen Subdomains:

 (www|support)
Keyword-Tabelle in der SISTRIX Toolbox für apple.com mit angewendetem Regex-Filter „(www|support)“.

Wir können einen Ausschlussfilter verwenden, um beispielsweise rein transaktionale Subdomains zu trennen und informative Keywords aus den Blogs oder FAQs wegzulassen.

 ^^(?!.*(www|support).*?)
Keyword-Tabelle in der SISTRIX Toolbox für apple.com mit angewendetem Regex-Filter "^(?!.*(www|support).*?)".

Schließen Sie URLs ein oder aus, die mit / enden oder nicht enden

Endet die .com-Domain der Startseite mit einem Schrägstrich, kann die Regex entsprechend angepasst werden:

 ^.*.com/$
 ^(?!(.*.com/$))

Jede URL, die mit / endet

 .*/$

Wir können diese Regex auch für URLs verwenden, um uns ausschließlich auf URLs zu konzentrieren, die mit dem Schrägstrich (/) enden. Geben Sie dazu die Domain in die Suchleiste ein (1), klicken Sie dann in der Navigation auf URLs (2), fügen Sie einen Filter hinzu (3) und wählen Sie den URL-Filter als „regulären Ausdruck“ (4):

1
2
3
4

Das funktioniert natürlich auch für URLs, die nicht auf / enden.

 ^(?!(.*/$))
URLs-Tabelle in der SISTRIX Toolbox für apple.com mit angewendetem URL-Regex-Filter "^(?!(.*/$))".

Schließen Sie URLs mit Zahlen ein oder aus

Wir können an der URL-Syntax basteln, um herauszufinden, welche Zahlen enthalten, um sie einzuschließen oder auszuschließen:

 .*-[0-9].*
 ^(?!(.*-[0-9].*))

Wenn wir etwas Spezifischeres wollen und wir wissen, dass es URLs gibt, die mit einer bestimmten Nummer enden, können wir sie auch wie folgt einschließen oder ausschließen:

 .*-[0-9]+$
 ^(?!(.*-[0-9]+$))

In diesem Fall bestand unsere Anforderung darin, Ketten zu filtern, die Serien von 8 aufeinanderfolgenden Nummern enthalten.

 .*[0-9]{8}.html$
 ^(?!(.*[0-9]{8}.html$))

Schließen Sie URLs in einem bestimmten Format ein oder aus

Wir können Regex auch zum Filtern von URL-Formaten verwenden. Zum Beispiel htm- oder html-URLs sowie PDF-URLs.

Das ist ziemlich einfach, da wir uns auf „Endet mit“- oder „Enthält“-Filter verlassen können, um dies zu tun.

 .*htm.?$
 .*pdf$

So schließen Sie die gewünschten URL-Formate aus:

 ^(?!(.*html.?$).)
 ^(?!(.*pdf.?$).)

Wir können mehrere Formate innerhalb desselben Ausdrucks verwenden, was wertvoller ist und uns die Mühe erspart, mehrere Filter zu verketten, um Folgendes einzuschließen:

 .*(htm|html)$
 .*(jpg|jpeg|gif|png)$

Und wir können auch auszuschließende Formate kombinieren:

 ^(?!(.*(htm|html)$).)
 ^(?!(.*htm.?)$).)
 ^(?!(.*(jpg|jpeg|gif|png)$).)

Schließen Sie URLs ein oder aus, die sich auf falsche Märkte beziehen

Wir können URLs überwachen, die nicht in den Ergebnissen eines bestimmten Marktes erscheinen sollten. Zum Beispiel URLs, die sich auf den US-amerikanischen, mexikanischen oder deutschen Markt beziehen, die in den Ergebnissen des spanischen erscheinen.

Nehmen wir die folgenden URL-Instanzen als unsere Basis:

Spaniens Spanisch /es_es/

Britisches Englisch /en_gb/

US-Englisch /en_us/

Italiens Italienisch /it_it/

Und so weiter.

Wir können Regex verwenden, um die Anzahl der URLs zu filtern, die nicht zum spanischen Markt gehören.

 ^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)
Keyword-Tabelle in der SISTRIX Toolbox für hm.com mit angewendetem Regex-Filter „^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)“. .

Wie Sie sehen können, lässt der Ausdruck die Homepage-URL zu, auf der sich die Sprachauswahl befindet.

Um diesen Ausdruck weiter zu verfeinern und die Startseite wegzulassen, können wir ihn wie folgt erweitern:

 ^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)
Keyword-Tabelle in der SISTRIX Toolbox für hm.com mit dem Regex-Filter "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)" angewendet.

Zusammenfassung

Mit den in diesem Beitrag bereitgestellten Parametern sind Sie nun in der Lage, Ihre eigenen Anwendungsfälle zu finden, in denen sich reguläre Ausdrücke als nützlich erweisen und Ihnen helfen können, Ihre SEO-Analysen effizienter zu gestalten.

Sie können mit Tools wie https://www.Regextester.com/ oder direkt mit den URL-, Keyword- oder Snippet-Filtern von SISTRIX weiter testen und üben.

Auch wenn wir keinen Support für Regex anbieten, werden wir dieses Tutorial weiterhin mit neuen Anwendungsfällen und SEO-Analysen aktualisieren, die sich für Sie als nützlich erweisen könnten.