So verwenden Sie reguläre Ausdrücke in der Toolbox
Veröffentlicht: 2022-04-17- Was ist ein regulärer Ausdruck?
- Wie können wir reguläre Ausdrücke erstellen?
- SEO-Beispiele mit regulären Ausdrücken
- Filtern von Schlüsselwörtern mit regulären Ausdrücken
- Markennamen einschließen oder ausschließen
- Schließen Sie Fehler in Markenbegriffen ein oder aus
- Schließen Sie Keyword-Begriffe ein oder aus, die mit bestimmten Wörtern enden
- Schließen Sie Keyword-Begriffe ein oder aus, die mit bestimmten Wörtern beginnen
- Schließen Sie Keyword-Begriffe ein oder aus, die sich auf bestimmte Attribute beziehen
- Keyword-Begriffe einschließen oder ausschließen, die den Namen von Städten im Vereinigten Königreich enthalten
- URLs mit regulären Ausdrücken filtern
- Unterdomänen einschließen oder ausschließen
- Schließen Sie URLs ein oder aus, die mit / enden oder nicht enden
- Schließen Sie URLs mit Zahlen ein oder aus
- Schließen Sie URLs in einem bestimmten Format ein oder aus
- Schließen Sie URLs ein oder aus, die sich auf falsche Märkte beziehen
- Zusammenfassung
Was ist ein regulärer Ausdruck?
Ein regulärer Ausdruck wird verwendet, um ein Muster zu überprüfen oder zu verifizieren. Ihre Hauptanwendung ist das Filtern von Elementen und das Finden von Übereinstimmungen, beispielsweise in den folgenden Szenarien:
- Analytik: Sie könnten Regex verwenden, um den Datenverkehr zu segmentieren.
- Htaccess: Sie könnten URLs effizienter umschreiben.
- SISTRIX: Sie können unsere Berichte nach URLs, Snippets oder Schlüsselwörtern filtern.
Reguläre Ausdrücke – oder Regex – können in vielen Programmiersprachen verwendet werden, aber dieses Tutorial basiert auf Perl, da es den Standard verwendet, auf dem die bereits verfügbare SISTRIX Regex-Funktionalität basiert.
Wie können wir reguläre Ausdrücke erstellen?
Wir werden dies tun, indem wir Zeichen, Gruppierungen, Quantifizierer und Klassen verwenden, da dies die Syntax ist, mit der wir Ausdrücke erstellen können.
Figuren | Verhalten | Beispiel |
---|---|---|
? | Sucht 1- oder 0-mal nach dem vorhergehenden Zeichen. | https? |
* | Sucht 0 oder öfter nach dem vorhergehenden Zeichen. | 30* |
+ | Sucht mindestens einmal nach dem vorhergehenden Zeichen. | [0-9]+ |
| | Sucht nach dem einen oder anderen Element. (oder) | (jpg|jpeg) |
^ | Zeigt den Beginn des Musters an | ^https |
$ | Zeigt das Ende des Musters an | html$ |
· | Sucht nach einem beliebigen Zeichen (Platzhalter) | 4.. |
\ | Interpretiert kein Sonderzeichen (Zeichen überspringen) | \/ |
Gruppierung | Verhalten | Beispiel |
---|---|---|
() | Erfasst bestimmte Inhalte | (Sistrix) Entspricht Sistrix |
[] | Erfasst Zeichen innerhalb der Klammern | [0-9] Entspricht einem beliebigen numerischen Zeichen [az] Entspricht jedem Kleinbuchstaben |
{} | Gibt die Anzahl der Iterationen an, Minimum oder Maximum | .{1,3} Übereinstimmungen mit einem beliebigen Zeichen, das zwischen 1 und 3 Mal wiederholt wird. |
In diesem Tutorial werden wir keine Quantifizierer verwenden, aber wir denken, dass es trotzdem interessant für Sie ist, sich mit ihnen vertraut zu machen, falls Sie sie in anderen Umgebungen verwenden.
Quantifizierer | Verhalten |
---|---|
\w | Sucht nach einem Wort, einer Ziffer oder einem Zeichentyp _ |
\d | Sucht nach einer Ziffer |
\s | Sucht nach einem Leerzeichen |
\b | Entspricht dem Anfang oder Ende eines Wortes |
\W | Sucht nach einem Zeichen, das kein Wort, keine Ziffer oder _ ist |
\D | Sucht nach einem Zeichen, das keine Ziffer ist |
\S | Sucht nach einem Zeichen, das kein Leerzeichen ist. |
SEO-Beispiele mit regulären Ausdrücken
Um die vorgeschlagenen Beispiele verwenden zu können, müssen Sie zum Abschnitt „Schlüsselwörter“ gehen und Schlüsselwort-, URL-, Titel- oder Beschreibungsfilter verwenden.
Filtern von Schlüsselwörtern mit regulären Ausdrücken
Um auf diese Funktion zuzugreifen, müssen Sie nur eine Domain analysieren 1 und zu Schlüsselwörtern 2 und dann zur Filterauswahl 3 gehen

Verwenden Sie dann den Schlüsselwortfilter mit Regex 4 .

Nun möchten wir Ihnen mehrere Anwendungsfälle vorschlagen, in denen Sie diese Ausdrücke anwenden können, um das Beste aus der Keyword-Analyse Ihrer Projekte oder der Analyse Ihrer Mitbewerber herauszuholen.
Markennamen einschließen oder ausschließen
Stellen Sie sich vor, Sie haben eine Marke, die verschiedene Schreibweisen akzeptiert oder unter mehreren verschiedenen Markennamen bekannt ist. Wir können einen regulären Ausdruck erstellen, um alle Keywords zu gruppieren, die wir als Markenbegriffe betrachten. Zum Beispiel hat currys.co.uk verschiedene Marken-Keywords, nämlich:
Curry, Currys, PC-Welt
Daher verwenden wir den folgenden Ausdruck:
(curry|currys|pc world).*

Unten sehen Sie die Ergebnisse, die wir erhalten würden:
Es ist auch möglich, den Filter so einzustellen, dass Marken-Keywords ausgeschlossen werden, indem der folgende Ausdruck verwendet wird, und es werden nur generische Keywords angezeigt:
^(?!.*(curry|currys|pc world).*?)

Schließen Sie Fehler in Markenbegriffen ein oder aus
Es besteht die Möglichkeit, dass wir auf Marken stoßen, die oft falsch geschrieben oder mit Fehlern geschrieben sind, wie z. B. Ryanair.
Hier sind einige Beispiele für Begriffe, die Benutzer eingeben, um nach dieser Fluggesellschaft zu suchen:
- Ryanair
- Rayaner
- Ryan ir
- rayan ir
- rayana eir
- raya nair
- rayan ari
- Rayar-Luft
Wir haben über 35 Markennamen identifiziert, die wir mit nur einem einzigen regulären Ausdruck erfassen können:
So schließen Sie alle Markenvarianten ein:
(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?
![Keyword-Tabelle in der SISTRIX Toolbox für ryanair.com mit dem Regex-Filter ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| Linien| )?(Linie|ir)?" angewandt.](/uploads/article/246/J4RlqK5XMR1iRPm6.png)
So schließen Sie alle Markenvarianten aus:
^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$
![Keyword-Tabelle in der SISTRIX Toolbox für ryanair.com mit dem Regex-Filter "^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air) ?(e|lines| )?(line|ir)?).)*$" angewendet.](/uploads/article/246/x8B4lxmc6Vmja5ch.png)
Natürlich können wir noch andere Filter auf diese Liste anwenden, wie „enthält“, „enthält nicht“, „endet mit“ oder „beginnt mit“.
Schließen Sie Keyword-Begriffe ein oder aus, die mit bestimmten Wörtern enden
Um nach einem eindeutigen Schlüsselwort zu suchen, reicht ein einfacher Filter aus, aber wenn wir eine Suche mit mehreren Bedingungen durchführen möchten, zum Beispiel: alle Schlüsselwörter, die mit „kaufen“ beginnen und mit „online“ enden, können wir verwenden:
^buy.*online$
Dies würde, angewendet auf einen Online-Shop wie screwfix.com, die folgenden Ergebnisse zurückgeben:

Schließen Sie Keyword-Begriffe ein oder aus, die mit bestimmten Wörtern beginnen
Aus Sicht eines Vergleichstools kann es interessant sein, Keywords filtern zu können, die verschiedene Markennamen enthalten.
Zum Beispiel können wir einen regulären Ausdruck erstellen, der Begriffe basierend auf den gewünschten Kriterien gruppiert, was in diesem Fall jeder Schlüsselwortbegriff ist, der mit einem Markennamen beginnt, der in Klammern steht:

^(sony|panasonic|philips|samsung).*
Ebenso können wir sie verwenden, um sie auszuschließen:
^(?!(sony|panasonic|philips|samsung).*)
Schließen Sie Keyword-Begriffe ein oder aus, die sich auf bestimmte Attribute beziehen
Versuchen wir dies anhand eines Beispiels für ein Attribut, das häufig in vielen Projekten vorkommt: Preis.
Es gibt viele Suchanfragen, die auf den Preis anspielen, wie zum Beispiel: „günstig“, „Rabatt“, „Outlet“, „Gutschein“, „Angebot“, „günstig“, „Budget“ usw.
Wenn wir sie aus den Ergebnissen ausschließen möchten, können wir den folgenden Ausdruck verwenden:
.*(cheap|budget|offer|outlet|price).*

Unter Verwendung der dynamischen Spalten der Tabelle können wir die Daten nach Suchvolumen in absteigender Reihenfolge organisieren, indem wir einfach auf die Kopfzeile der Spalte klicken.
In anderen Fällen können wir auch andere Attribute wie Farben, Formen, Größen, Ziel usw. verwenden.
Keyword-Begriffe einschließen oder ausschließen, die den Namen von Städten im Vereinigten Königreich enthalten
Viele Projekte erfordern eine lokale Präsenzverfolgung. Dazu können wir Regex verwenden, um Provinzen, Regionen, Städte, Gemeinden usw. zu gruppieren.
In diesem Beispiel verwenden wir die Liste der Städte, um einen regulären Ausdruck zu erstellen, der Keyword-Begriffe filtert, die eine Stadt enthalten.
.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*
Jedes E-Commerce-Unternehmen oder Vergleichstool mit physischer Präsenz kann diesen Ausdruck verwenden, um Städte auszuschließen und sogar Marken-Keywords hinzuzufügen oder andere Parameter auszuschließen.
^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))
Wir können sie jedoch auch in mehrere Ausdrücke aufteilen, wie unten gezeigt:

Von hier an fügen wir den Expertenfilter hinzu, um anzuzeigen, dass diese beiden Ausdrücke vom Typ „und“ statt vom Typ „oder“ sind.


URLs mit regulären Ausdrücken filtern
Die Schritte, die Sie befolgen müssen, um URLs zu filtern, sind die gleichen wie die, die wir für Schlüsselwörter untersucht haben, der einzige Unterschied besteht darin, dass Sie „URLs“ und dann reguläre Ausdrücke auswählen müssten.

Unterdomänen einschließen oder ausschließen
Nachdem wir nun gelernt haben, wie man reguläre Ausdrücke zum Filtern von Schlüsselwörtern verwendet, wollen wir einige typische SEO-Anwendungsfälle finden, in denen wir URLs filtern müssten.
Hier sind einige grundlegende Anwendungsfälle für die Analyse einer gesamten Domain und die Gruppierung von URLs nach strategischen Subdomains:
(www|support)

Wir können einen Ausschlussfilter verwenden, um beispielsweise rein transaktionale Subdomains zu trennen und informative Keywords aus den Blogs oder FAQs wegzulassen.
^^(?!.*(www|support).*?)

Schließen Sie URLs ein oder aus, die mit / enden oder nicht enden
Endet die .com-Domain der Startseite mit einem Schrägstrich, kann die Regex entsprechend angepasst werden:
^.*.com/$
^(?!(.*.com/$))
Jede URL, die mit / endet
.*/$
Wir können diese Regex auch für URLs verwenden, um uns ausschließlich auf URLs zu konzentrieren, die mit dem Schrägstrich (/) enden. Geben Sie dazu die Domain in die Suchleiste ein (1), klicken Sie dann in der Navigation auf URLs (2), fügen Sie einen Filter hinzu (3) und wählen Sie den URL-Filter als „regulären Ausdruck“ (4):

Das funktioniert natürlich auch für URLs, die nicht auf / enden.
^(?!(.*/$))

Schließen Sie URLs mit Zahlen ein oder aus
Wir können an der URL-Syntax basteln, um herauszufinden, welche Zahlen enthalten, um sie einzuschließen oder auszuschließen:
.*-[0-9].*
^(?!(.*-[0-9].*))
Wenn wir etwas Spezifischeres wollen und wir wissen, dass es URLs gibt, die mit einer bestimmten Nummer enden, können wir sie auch wie folgt einschließen oder ausschließen:
.*-[0-9]+$
^(?!(.*-[0-9]+$))
In diesem Fall bestand unsere Anforderung darin, Ketten zu filtern, die Serien von 8 aufeinanderfolgenden Nummern enthalten.
.*[0-9]{8}.html$
^(?!(.*[0-9]{8}.html$))
Schließen Sie URLs in einem bestimmten Format ein oder aus
Wir können Regex auch zum Filtern von URL-Formaten verwenden. Zum Beispiel htm- oder html-URLs sowie PDF-URLs.
Das ist ziemlich einfach, da wir uns auf „Endet mit“- oder „Enthält“-Filter verlassen können, um dies zu tun.
.*htm.?$
.*pdf$
So schließen Sie die gewünschten URL-Formate aus:
^(?!(.*html.?$).)
^(?!(.*pdf.?$).)
Wir können mehrere Formate innerhalb desselben Ausdrucks verwenden, was wertvoller ist und uns die Mühe erspart, mehrere Filter zu verketten, um Folgendes einzuschließen:
.*(htm|html)$
.*(jpg|jpeg|gif|png)$
Und wir können auch auszuschließende Formate kombinieren:
^(?!(.*(htm|html)$).)
^(?!(.*htm.?)$).)
^(?!(.*(jpg|jpeg|gif|png)$).)
Schließen Sie URLs ein oder aus, die sich auf falsche Märkte beziehen
Wir können URLs überwachen, die nicht in den Ergebnissen eines bestimmten Marktes erscheinen sollten. Zum Beispiel URLs, die sich auf den US-amerikanischen, mexikanischen oder deutschen Markt beziehen, die in den Ergebnissen des spanischen erscheinen.
Nehmen wir die folgenden URL-Instanzen als unsere Basis:
Spaniens Spanisch /es_es/
Britisches Englisch /en_gb/
US-Englisch /en_us/
Italiens Italienisch /it_it/
Und so weiter.
Wir können Regex verwenden, um die Anzahl der URLs zu filtern, die nicht zum spanischen Markt gehören.
^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)
![Keyword-Tabelle in der SISTRIX Toolbox für hm.com mit angewendetem Regex-Filter „^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)“. .](/uploads/article/246/TIPPU8qnSB57ontM.png)
Wie Sie sehen können, lässt der Ausdruck die Homepage-URL zu, auf der sich die Sprachauswahl befindet.
Um diesen Ausdruck weiter zu verfeinern und die Startseite wegzulassen, können wir ihn wie folgt erweitern:
^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)
![Keyword-Tabelle in der SISTRIX Toolbox für hm.com mit dem Regex-Filter "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)" angewendet.](/uploads/article/246/vxYA4KacpOcflwYd.png)
Zusammenfassung
Mit den in diesem Beitrag bereitgestellten Parametern sind Sie nun in der Lage, Ihre eigenen Anwendungsfälle zu finden, in denen sich reguläre Ausdrücke als nützlich erweisen und Ihnen helfen können, Ihre SEO-Analysen effizienter zu gestalten.
Sie können mit Tools wie https://www.Regextester.com/ oder direkt mit den URL-, Keyword- oder Snippet-Filtern von SISTRIX weiter testen und üben.
Auch wenn wir keinen Support für Regex anbieten, werden wir dieses Tutorial weiterhin mit neuen Anwendungsfällen und SEO-Analysen aktualisieren, die sich für Sie als nützlich erweisen könnten.