Come utilizzare le espressioni regolari nella casella degli strumenti

Pubblicato: 2022-04-17
Contenuti
Contenuti

Che cos'è un'espressione regolare?

Un'espressione regolare viene utilizzata per controllare o verificare un modello. La loro applicazione principale è per filtrare elementi e trovare corrispondenze, ad esempio, nei seguenti scenari:

  • Analytics: puoi utilizzare Regex per segmentare il traffico.
  • Htaccess: potresti riscrivere gli URL in modo più efficiente.
  • SISTRIX: puoi filtrare i nostri report contenenti URL, snippet o parole chiave.

Le espressioni regolari, o Regex, possono essere utilizzate in molti linguaggi di programmazione, ma questo tutorial sarà basato su Perl, poiché utilizza lo standard su cui si basa la funzionalità SISTRIX Regex già disponibile .

Come possiamo costruire espressioni regolari?

Lo faremo usando caratteri, raggruppamenti, quantificatori e classi, poiché è la sintassi attraverso la quale saremo in grado di costruire espressioni.

Sintassi per creare un'espressione regolare
Caratteri Comportamento Esempio
? Cerca il carattere precedente 1 o 0 volte. https?
* Cerca il carattere precedente 0 o più volte. 30*
+ Cerca il carattere precedente 1 o più volte. [0-9]+
| Cerca un elemento o un altro. (o) (jpg|jpeg)
^ Indica l'inizio del pattern ^https
$ Indica la fine del motivo html$
· Cerca qualsiasi personaggio (jolly) 4..
\ Non interpreta un carattere speciale (salta i caratteri) \/
Opzioni di raggruppamento per le espressioni regolari
Raggruppamento Comportamento Esempio
() Acquisisce contenuto specifico (sorella)
Corrisponde a sorella
[] Cattura i caratteri tra parentesi [0-9]
Corrisponde a qualsiasi carattere numerico
[az]
Corrisponde a qualsiasi lettera minuscola
{} Indica il numero di iterazioni, minimo o massimo .{1,3} Corrisponde a qualsiasi carattere ripetuto da 1 a 3 volte.

In questo tutorial non useremo quantificatori, ma pensiamo che sia comunque interessante per te familiarizzare con loro nel caso in cui li utilizzi in altri ambienti.

Quantificatori nelle espressioni regolari
Quantificatori Comportamento
\w Cerca una parola, una cifra o _ tipo di carattere
\d Cerca un carattere cifra
\S Cerca uno spazio vuoto
\b Corrisponde all'inizio o alla fine di una parola
\W Cerca un carattere che non sia una parola, una cifra o _
\D Cerca un carattere che non sia una cifra
\S Cerca un carattere che non sia uno spazio bianco.

Esempi SEO con espressioni regolari

Per poter utilizzare gli esempi suggeriti, devi andare alla sezione "Parole chiave" e utilizzare i filtri Parola chiave, URL, Titolo o Descrizione.

Filtraggio di parole chiave con espressioni regolari

Per accedere a questa funzionalità è sufficiente analizzare un dominio 1 e andare su Parole chiave 2 , quindi passare alla selezione Filtro 3

1
2
3

E poi, usa il filtro delle parole chiave con Regex 4 .

4

Ora vorremmo proporre diversi casi d'uso in cui puoi applicare queste espressioni per ottenere il massimo dall'analisi delle parole chiave dei tuoi progetti o quando stai analizzando i tuoi concorrenti.

Includi o escludi il nome del marchio

Immagina di avere un marchio che accetta ortografie diverse o che è conosciuto con diversi nomi di marchi. Possiamo creare un'espressione regolare per raggruppare tutte le parole chiave che consideriamo termini di marca. Ad esempio, currys.co.uk ha varie parole chiave di marca, vale a dire:

curry, curry, mondo dei pc

Useremo quindi la seguente espressione:

 (curry|currys|pc world).*
Tabella delle parole chiave nel Toolbox SISTRIX per currys.co.uk con il filtro regex ".*(curry|currys|pc world).*" applicato.

Di seguito puoi vedere i risultati che otterremmo:

È anche possibile impostare il filtro per escludere le parole chiave di marca, utilizzando la seguente espressione, e visualizzerà solo parole chiave generiche:

 ^(?!.*(curry|currys|pc world).*?)
Tabella delle parole chiave nel Toolbox SISTRIX per currys.co.uk con il filtro regex ".^(?!.*(curry|currys|pc world).*?)" applicato.

Includere o escludere errori in termini di marca

C'è la possibilità che ci imbattiamo in marchi, che spesso sono scritti in modo errato o scritti con errori, come Ryanair.

Ecco alcuni esempi di termini inseriti dagli utenti per cercare questa compagnia aerea:

  • Ryanair
  • rayaner
  • Ryan Ir
  • rayan ir
  • rayana eir
  • Raya Nair
  • rayan ari
  • aria di raggio

Abbiamo identificato oltre 35 marchi che possiamo acquisire utilizzando una sola espressione regolare:

Per includere tutte le varianti del marchio:

 (r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?
Tabella delle parole chiave in SISTRIX Toolbox per ryanair.com con il filtro regex ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| righe| )?(riga|ir)?" applicato.

Per escludere tutte le varianti del marchio:

 ^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$
Tabella delle parole chiave in SISTRIX Toolbox per ryanair.com con il filtro regex "^(((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air) ?(e|lines| )?(line|ir)?).)*$" applicato.

Ovviamente possiamo ancora applicare altri filtri a questo elenco, come "contiene", "non contiene", "finisce con" o "inizia con".

Includere o escludere termini di parole chiave che terminano con parole specifiche

Per cercare una parola chiave univoca sarà sufficiente un semplice filtro, ma se volessimo effettuare una ricerca con più condizioni, ad esempio: tutte le parole chiave che iniziano con “acquista” e terminano con “online”, possiamo utilizzare:

 ^buy.*online$

Questo, applicato a un negozio online come screwfix.com, restituirebbe i seguenti risultati:

Tabella delle parole chiave in SISTRIX Toolbox per currys.co.uk con il filtro regex "^buy.*online$" applicato.

Includi o escludi parole chiave che iniziano con parole specifiche

Dal punto di vista di uno strumento di confronto può essere interessante poter filtrare parole chiave contenenti vari marchi.

Ad esempio, possiamo creare un'espressione regolare che raggrupperà i termini in base ai criteri desiderati, che in questo caso è qualsiasi termine di parola chiave che inizia con qualsiasi marchio incluso tra parentesi:

 ^(sony|panasonic|philips|samsung).*

Allo stesso modo, possiamo usarlo per escluderli:

 ^(?!(sony|panasonic|philips|samsung).*)

Includere o escludere termini di parole chiave correlati ad attributi specifici

Proviamo questo con un esempio di un attributo che si incontra comunemente in molti progetti: prezzo.

Esistono molte query di ricerca che alludono al prezzo, come ad esempio: “economico”, “sconto”, “outlet”, “coupon”, “offerta”, “low cost”, “budget”, ecc.

Se vogliamo escluderli dai risultati, possiamo usare la seguente espressione:

 .*(cheap|budget|offer|outlet|price).*
Tabella delle parole chiave nel Toolbox SISTRIX per skinflint.co.uk con il filtro regex ".*(cheap|budget|offerta|outlet|prezzo).*" applicato.

Utilizzando le colonne dinamiche della tabella, possiamo organizzare i dati per volume di ricerca in ordine decrescente, semplicemente cliccando sull'intestazione della colonna.

In altri casi possiamo anche utilizzare altri attributi come colori, forme, dimensioni, target, ecc.

Includere o escludere termini di parole chiave contenenti il ​​nome di città nel Regno Unito

Molti progetti richiedono un monitoraggio della presenza locale. Per fare ciò, possiamo utilizzare Regex per raggruppare province, regioni, città, paesi, ecc.

In questo esempio prenderemo l'elenco delle città per creare un'espressione regolare che filtrerà i termini delle parole chiave contenenti una città.

 .*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*

Qualsiasi attività di e-commerce o uno strumento di confronto con una presenza fisica può utilizzare questa espressione per escludere città e persino aggiungere parole chiave di marca o escludere altri parametri.

 ^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))

Tuttavia, possiamo anche separarli in più espressioni, come mostrato di seguito:

Riquadro Filtra risultati per la tabella delle parole chiave di SISTRIX Toolbox. Il filtro è impostato su "Parola chiave" e quindi su "Espressione regolare". La regex inserita è "^(?!.*(nike|jordan|air|niketown).*?)".

Da qui in poi aggiungiamo il Filtro Esperto per indicare che queste due espressioni sono di tipo “e”, invece di tipo “o”.

Opzioni della tabella per la tabella delle parole chiave. Si trovano nella barra di navigazione in alto accanto a "data". L'opzione "Filtro esperto" è selezionata.
Keyword Table nel SISTRIX Toolbox per nike.com con i filtri esperti attivati. Ecco due filtri regex combinati dal booleano AND.

Filtraggio di URL con espressioni regolari

I passaggi che devi seguire per filtrare gli URL sono gli stessi che abbiamo esplorato per le parole chiave, l'unica differenza è che dovresti selezionare "URL" e quindi espressioni regolari.

Riquadro Filtra risultati per la tabella delle parole chiave di SISTRIX Toolbox. Il filtro è impostato su "URL" e quindi su "Espressione regolare".

Includi o escludi sottodomini

Ora che abbiamo imparato a utilizzare le espressioni regolari per filtrare le parole chiave, troviamo alcuni casi d'uso SEO tipici in cui avremmo bisogno di filtrare gli URL.

Ecco alcuni casi d'uso di base per analizzare un intero dominio e raggruppare gli URL per sottodomini strategici:

 (www|support)
Tabella delle parole chiave in SISTRIX Toolbox per apple.com con il filtro regex "(www|support)" applicato.

Possiamo utilizzare un filtro di esclusione, ad esempio, per separare i sottodomini puramente transazionali e tralasciare le parole chiave informative provenienti dai blog o dalle FAQ.

 ^^(?!.*(www|support).*?)
Tabella delle parole chiave in SISTRIX Toolbox per apple.com con il filtro regex "^(?!.*(www|support).*?)" applicato.

Includi o escludi URL che terminano o non terminano con /

Se il dominio .com della home page termina con una barra, la regex può essere adattata in modo che corrisponda a:

 ^.*.com/$
 ^(?!(.*.com/$))

Qualsiasi URL che termina con /

 .*/$

Possiamo anche usare questa espressione regolare per gli URL, per concentrarci esclusivamente sugli URL che terminano con la barra (/). Per fare ciò, inserisci il dominio nella barra di ricerca (1), quindi fai clic su URL nella navigazione (2), aggiungi un filtro (3) e scegli il filtro URL come "espressione regolare" (4):

1
2
3
4

Naturalmente, questo funziona anche per gli URL che non terminano con /

 ^(?!(.*/$))
Tabella URL in SISTRIX Toolbox per apple.com con il filtro regex URL "^(?!(.*/$))" applicato.

Includi o escludi URL contenenti numeri

Possiamo armeggiare con la sintassi dell'URL per identificare quali contengono numeri da includere o escludere:

 .*-[0-9].*
 ^(?!(.*-[0-9].*))

Se vogliamo qualcosa di più specifico e sappiamo che ci sono URL che terminano con un numero particolare, possiamo anche includerli o escluderli come segue:

 .*-[0-9]+$
 ^(?!(.*-[0-9]+$))

In questo caso la nostra richiesta era di filtrare catene contenenti serie di 8 numeri consecutivi.

 .*[0-9]{8}.html$
 ^(?!(.*[0-9]{8}.html$))

Includi o escludi URL in un formato particolare

Possiamo anche usare Regex per filtrare i formati degli URL. Ad esempio, URL htm o html, oltre a quelli pdf.

Questo è abbastanza facile, poiché possiamo contare su filtri "finisce con" o "contiene" per farlo.

 .*htm.?$
 .*pdf$

Per escludere i formati URL desiderati:

 ^(?!(.*html.?$).)
 ^(?!(.*pdf.?$).)

Possiamo utilizzare diversi formati all'interno della stessa espressione, il che sarà più prezioso e ci eviterà il fastidio di concatenare diversi filtri, per includere:

 .*(htm|html)$
 .*(jpg|jpeg|gif|png)$

E possiamo anche combinare formati da escludere:

 ^(?!(.*(htm|html)$).)
 ^(?!(.*htm.?)$).)
 ^(?!(.*(jpg|jpeg|gif|png)$).)

Includi o escludi URL relativi a mercati errati

Possiamo monitorare gli URL che non dovrebbero apparire nei risultati di un mercato specifico. Ad esempio, gli URL relativi ai mercati statunitense, messicano o tedesco che compaiono nei risultati di quello spagnolo.

Prendendo come base le seguenti istanze URL:

Spagnolo spagnolo /es_es/

Inglese britannico /it_it/

Inglese americano /en_us/

Italiano d'Italia /it_it/

E così via.

Possiamo usare Regex per filtrare il numero di URL che non appartengono al mercato spagnolo.

 ^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)
Tabella delle parole chiave in SISTRIX Toolbox per hm.com con il filtro regex "^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)" applicato .

Come puoi vedere, l'espressione consente l'URL della home page, dove si trova il selettore della lingua.

Per rifinire ulteriormente questa espressione e lasciare fuori la home page, possiamo estenderla come mostrato di seguito:

 ^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)
Tabella delle parole chiave in SISTRIX Toolbox per hm.com con il filtro regex "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)" applicato.

Sommario

Con i parametri forniti in questo post ora sei in grado di trovare i tuoi casi d'uso in cui le espressioni regolari possono tornare utili e aiutarti a rendere più efficienti le tue analisi SEO.

Puoi continuare a testare ed esercitarti con strumenti come https://www.Regextester.com/ o direttamente con i filtri URL, parole chiave o snippet di SISTRIX.

Anche se non forniamo supporto per Regex, continueremo ad aggiornare questo tutorial con nuovi casi di utilizzo e analisi SEO che potrebbero rivelarsi utili per te.