Come utilizzare le espressioni regolari nella casella degli strumenti
Pubblicato: 2022-04-17- Che cos'è un'espressione regolare?
- Come possiamo costruire espressioni regolari?
- Esempi SEO con espressioni regolari
- Filtraggio di parole chiave con espressioni regolari
- Includi o escludi il nome del marchio
- Includere o escludere errori in termini di marca
- Includere o escludere termini di parole chiave che terminano con parole specifiche
- Includi o escludi parole chiave che iniziano con parole specifiche
- Includere o escludere termini di parole chiave correlati ad attributi specifici
- Includere o escludere termini di parole chiave contenenti il nome di città nel Regno Unito
- Filtraggio di URL con espressioni regolari
- Includi o escludi sottodomini
- Includi o escludi URL che terminano o non terminano con /
- Includi o escludi URL contenenti numeri
- Includi o escludi URL in un formato particolare
- Includi o escludi URL relativi a mercati errati
- Sommario
Che cos'è un'espressione regolare?
Un'espressione regolare viene utilizzata per controllare o verificare un modello. La loro applicazione principale è per filtrare elementi e trovare corrispondenze, ad esempio, nei seguenti scenari:
- Analytics: puoi utilizzare Regex per segmentare il traffico.
- Htaccess: potresti riscrivere gli URL in modo più efficiente.
- SISTRIX: puoi filtrare i nostri report contenenti URL, snippet o parole chiave.
Le espressioni regolari, o Regex, possono essere utilizzate in molti linguaggi di programmazione, ma questo tutorial sarà basato su Perl, poiché utilizza lo standard su cui si basa la funzionalità SISTRIX Regex già disponibile .
Come possiamo costruire espressioni regolari?
Lo faremo usando caratteri, raggruppamenti, quantificatori e classi, poiché è la sintassi attraverso la quale saremo in grado di costruire espressioni.
Caratteri | Comportamento | Esempio |
---|---|---|
? | Cerca il carattere precedente 1 o 0 volte. | https? |
* | Cerca il carattere precedente 0 o più volte. | 30* |
+ | Cerca il carattere precedente 1 o più volte. | [0-9]+ |
| | Cerca un elemento o un altro. (o) | (jpg|jpeg) |
^ | Indica l'inizio del pattern | ^https |
$ | Indica la fine del motivo | html$ |
· | Cerca qualsiasi personaggio (jolly) | 4.. |
\ | Non interpreta un carattere speciale (salta i caratteri) | \/ |
Raggruppamento | Comportamento | Esempio |
---|---|---|
() | Acquisisce contenuto specifico | (sorella) Corrisponde a sorella |
[] | Cattura i caratteri tra parentesi | [0-9] Corrisponde a qualsiasi carattere numerico [az] Corrisponde a qualsiasi lettera minuscola |
{} | Indica il numero di iterazioni, minimo o massimo | .{1,3} Corrisponde a qualsiasi carattere ripetuto da 1 a 3 volte. |
In questo tutorial non useremo quantificatori, ma pensiamo che sia comunque interessante per te familiarizzare con loro nel caso in cui li utilizzi in altri ambienti.
Quantificatori | Comportamento |
---|---|
\w | Cerca una parola, una cifra o _ tipo di carattere |
\d | Cerca un carattere cifra |
\S | Cerca uno spazio vuoto |
\b | Corrisponde all'inizio o alla fine di una parola |
\W | Cerca un carattere che non sia una parola, una cifra o _ |
\D | Cerca un carattere che non sia una cifra |
\S | Cerca un carattere che non sia uno spazio bianco. |
Esempi SEO con espressioni regolari
Per poter utilizzare gli esempi suggeriti, devi andare alla sezione "Parole chiave" e utilizzare i filtri Parola chiave, URL, Titolo o Descrizione.
Filtraggio di parole chiave con espressioni regolari
Per accedere a questa funzionalità è sufficiente analizzare un dominio 1 e andare su Parole chiave 2 , quindi passare alla selezione Filtro 3

E poi, usa il filtro delle parole chiave con Regex 4 .

Ora vorremmo proporre diversi casi d'uso in cui puoi applicare queste espressioni per ottenere il massimo dall'analisi delle parole chiave dei tuoi progetti o quando stai analizzando i tuoi concorrenti.
Includi o escludi il nome del marchio
Immagina di avere un marchio che accetta ortografie diverse o che è conosciuto con diversi nomi di marchi. Possiamo creare un'espressione regolare per raggruppare tutte le parole chiave che consideriamo termini di marca. Ad esempio, currys.co.uk ha varie parole chiave di marca, vale a dire:
curry, curry, mondo dei pc
Useremo quindi la seguente espressione:
(curry|currys|pc world).*

Di seguito puoi vedere i risultati che otterremmo:
È anche possibile impostare il filtro per escludere le parole chiave di marca, utilizzando la seguente espressione, e visualizzerà solo parole chiave generiche:
^(?!.*(curry|currys|pc world).*?)

Includere o escludere errori in termini di marca
C'è la possibilità che ci imbattiamo in marchi, che spesso sono scritti in modo errato o scritti con errori, come Ryanair.
Ecco alcuni esempi di termini inseriti dagli utenti per cercare questa compagnia aerea:
- Ryanair
- rayaner
- Ryan Ir
- rayan ir
- rayana eir
- Raya Nair
- rayan ari
- aria di raggio
Abbiamo identificato oltre 35 marchi che possiamo acquisire utilizzando una sola espressione regolare:
Per includere tutte le varianti del marchio:
(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?
![Tabella delle parole chiave in SISTRIX Toolbox per ryanair.com con il filtro regex ".(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e| righe| )?(riga|ir)?" applicato.](/uploads/article/246/J4RlqK5XMR1iRPm6.png)
Per escludere tutte le varianti del marchio:
^((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air)?(e|lines| )?(line|ir)?).)*$
![Tabella delle parole chiave in SISTRIX Toolbox per ryanair.com con il filtro regex "^(((?!(r|t)[hzeuayi]?[naiy].?[an]?[airn].?(r|t|air) ?(e|lines| )?(line|ir)?).)*$" applicato.](/uploads/article/246/x8B4lxmc6Vmja5ch.png)
Ovviamente possiamo ancora applicare altri filtri a questo elenco, come "contiene", "non contiene", "finisce con" o "inizia con".
Includere o escludere termini di parole chiave che terminano con parole specifiche
Per cercare una parola chiave univoca sarà sufficiente un semplice filtro, ma se volessimo effettuare una ricerca con più condizioni, ad esempio: tutte le parole chiave che iniziano con “acquista” e terminano con “online”, possiamo utilizzare:
^buy.*online$
Questo, applicato a un negozio online come screwfix.com, restituirebbe i seguenti risultati:

Includi o escludi parole chiave che iniziano con parole specifiche
Dal punto di vista di uno strumento di confronto può essere interessante poter filtrare parole chiave contenenti vari marchi.
Ad esempio, possiamo creare un'espressione regolare che raggrupperà i termini in base ai criteri desiderati, che in questo caso è qualsiasi termine di parola chiave che inizia con qualsiasi marchio incluso tra parentesi:
^(sony|panasonic|philips|samsung).*
Allo stesso modo, possiamo usarlo per escluderli:

^(?!(sony|panasonic|philips|samsung).*)
Includere o escludere termini di parole chiave correlati ad attributi specifici
Proviamo questo con un esempio di un attributo che si incontra comunemente in molti progetti: prezzo.
Esistono molte query di ricerca che alludono al prezzo, come ad esempio: “economico”, “sconto”, “outlet”, “coupon”, “offerta”, “low cost”, “budget”, ecc.
Se vogliamo escluderli dai risultati, possiamo usare la seguente espressione:
.*(cheap|budget|offer|outlet|price).*

Utilizzando le colonne dinamiche della tabella, possiamo organizzare i dati per volume di ricerca in ordine decrescente, semplicemente cliccando sull'intestazione della colonna.
In altri casi possiamo anche utilizzare altri attributi come colori, forme, dimensioni, target, ecc.
Includere o escludere termini di parole chiave contenenti il nome di città nel Regno Unito
Molti progetti richiedono un monitoraggio della presenza locale. Per fare ciò, possiamo utilizzare Regex per raggruppare province, regioni, città, paesi, ecc.
In questo esempio prenderemo l'elenco delle città per creare un'espressione regolare che filtrerà i termini delle parole chiave contenenti una città.
.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*
Qualsiasi attività di e-commerce o uno strumento di confronto con una presenza fisica può utilizzare questa espressione per escludere città e persino aggiungere parole chiave di marca o escludere altri parametri.
^(?!(.*(aberdeen|armagh|bangor|bath|belfast|birmingham|bradford|brighton|brighton & hove|bristol|cambridge|canterbury|cardiff|carlisle|chelmsford|chester|chichester|coventry|derby|derry|dundee|durham|edinburgh|ely|exeter|glasgow|gloucester|hereford|inverness|kingston|kingston upon hull|lancaster|leeds|leicester|lichfield|lincoln|lisburn|liverpool|london|manchester|newcastle|newcastle upon tyne|newport|newry|norwich|nottingham|oxford|perth|peterborough|plymouth|portsmouth|preston|ripon|st albans|st asaph|st davids|salford|salisbury|sheffield|southampton|stoke|stoke-on-trent|sunderland|swansea|truro|wakefield|wells|westminster|winchester|wolverhampton|worcester|york).*))
Tuttavia, possiamo anche separarli in più espressioni, come mostrato di seguito:

Da qui in poi aggiungiamo il Filtro Esperto per indicare che queste due espressioni sono di tipo “e”, invece di tipo “o”.


Filtraggio di URL con espressioni regolari
I passaggi che devi seguire per filtrare gli URL sono gli stessi che abbiamo esplorato per le parole chiave, l'unica differenza è che dovresti selezionare "URL" e quindi espressioni regolari.

Includi o escludi sottodomini
Ora che abbiamo imparato a utilizzare le espressioni regolari per filtrare le parole chiave, troviamo alcuni casi d'uso SEO tipici in cui avremmo bisogno di filtrare gli URL.
Ecco alcuni casi d'uso di base per analizzare un intero dominio e raggruppare gli URL per sottodomini strategici:
(www|support)

Possiamo utilizzare un filtro di esclusione, ad esempio, per separare i sottodomini puramente transazionali e tralasciare le parole chiave informative provenienti dai blog o dalle FAQ.
^^(?!.*(www|support).*?)

Includi o escludi URL che terminano o non terminano con /
Se il dominio .com della home page termina con una barra, la regex può essere adattata in modo che corrisponda a:
^.*.com/$
^(?!(.*.com/$))
Qualsiasi URL che termina con /
.*/$
Possiamo anche usare questa espressione regolare per gli URL, per concentrarci esclusivamente sugli URL che terminano con la barra (/). Per fare ciò, inserisci il dominio nella barra di ricerca (1), quindi fai clic su URL nella navigazione (2), aggiungi un filtro (3) e scegli il filtro URL come "espressione regolare" (4):

Naturalmente, questo funziona anche per gli URL che non terminano con /
^(?!(.*/$))

Includi o escludi URL contenenti numeri
Possiamo armeggiare con la sintassi dell'URL per identificare quali contengono numeri da includere o escludere:
.*-[0-9].*
^(?!(.*-[0-9].*))
Se vogliamo qualcosa di più specifico e sappiamo che ci sono URL che terminano con un numero particolare, possiamo anche includerli o escluderli come segue:
.*-[0-9]+$
^(?!(.*-[0-9]+$))
In questo caso la nostra richiesta era di filtrare catene contenenti serie di 8 numeri consecutivi.
.*[0-9]{8}.html$
^(?!(.*[0-9]{8}.html$))
Includi o escludi URL in un formato particolare
Possiamo anche usare Regex per filtrare i formati degli URL. Ad esempio, URL htm o html, oltre a quelli pdf.
Questo è abbastanza facile, poiché possiamo contare su filtri "finisce con" o "contiene" per farlo.
.*htm.?$
.*pdf$
Per escludere i formati URL desiderati:
^(?!(.*html.?$).)
^(?!(.*pdf.?$).)
Possiamo utilizzare diversi formati all'interno della stessa espressione, il che sarà più prezioso e ci eviterà il fastidio di concatenare diversi filtri, per includere:
.*(htm|html)$
.*(jpg|jpeg|gif|png)$
E possiamo anche combinare formati da escludere:
^(?!(.*(htm|html)$).)
^(?!(.*htm.?)$).)
^(?!(.*(jpg|jpeg|gif|png)$).)
Includi o escludi URL relativi a mercati errati
Possiamo monitorare gli URL che non dovrebbero apparire nei risultati di un mercato specifico. Ad esempio, gli URL relativi ai mercati statunitense, messicano o tedesco che compaiono nei risultati di quello spagnolo.
Prendendo come base le seguenti istanze URL:
Spagnolo spagnolo /es_es/
Inglese britannico /it_it/
Inglese americano /en_us/
Italiano d'Italia /it_it/
E così via.
Possiamo usare Regex per filtrare il numero di URL che non appartengono al mercato spagnolo.
^(?!(.*[es]_[az].*)|(.*[az]_[es].*).)
![Tabella delle parole chiave in SISTRIX Toolbox per hm.com con il filtro regex "^(?!(.*[es]_[a-z].*)|(.*[a-z]_[es].*).)" applicato .](/uploads/article/246/TIPPU8qnSB57ontM.png)
Come puoi vedere, l'espressione consente l'URL della home page, dove si trova il selettore della lingua.
Per rifinire ulteriormente questa espressione e lasciare fuori la home page, possiamo estenderla come mostrato di seguito:
^(?!(.*.com/$)|(.*[es]_[az].*)|(.*[az]_[es].*).)
![Tabella delle parole chiave in SISTRIX Toolbox per hm.com con il filtro regex "^(?!(.*.com/$)|(.*[es]_[a-z].*)|(.*[a-z]_[ es].*).)" applicato.](/uploads/article/246/vxYA4KacpOcflwYd.png)
Sommario
Con i parametri forniti in questo post ora sei in grado di trovare i tuoi casi d'uso in cui le espressioni regolari possono tornare utili e aiutarti a rendere più efficienti le tue analisi SEO.
Puoi continuare a testare ed esercitarti con strumenti come https://www.Regextester.com/ o direttamente con i filtri URL, parole chiave o snippet di SISTRIX.
Anche se non forniamo supporto per Regex, continueremo ad aggiornare questo tutorial con nuovi casi di utilizzo e analisi SEO che potrebbero rivelarsi utili per te.