Cos'è il tag canonico e come usarlo

Pubblicato: 2022-04-17
Contenuti
Contenuti

Definizione e significato

Il tag canonico è l'elemento HTML che utilizziamo per far sapere a Google che 2 o più URL sul nostro sito Web sono duplicati, simili o identici.

Questo tag ci consente di "selezionare" quale dei molteplici URL deve essere visualizzato nelle SERP, per aiutare Google a decidere quale pagina deve infine mostrare nei risultati. In altre parole, stiamo fornendo a Google un segnale che indica la versione preferita da indicizzare .

Oltre a rafforzare questo segnale di indicizzazione, consolida anche i nostri collegamenti interni che puntano dall'URL di origine all'URL canonico di destinazione.

Per quanto riguarda i contenuti duplicati e i vari miti che circolano nel settore, non c'è modo migliore per chiarirlo che citando fonti e riferimenti ufficiali provenienti dalla stessa Google:

"Mettiamolo a letto una volta per tutte, gente: non esiste una "penalità per contenuti duplicati". Almeno, non nel modo in cui la maggior parte delle persone intende quando lo dice. Puoi aiutare i tuoi colleghi webmaster non perpetuando il mito delle sanzioni sui contenuti duplicati!

Susan Moska
https://webmasters.googleblog.com/2008/09/demystifying-duplicate-content-penalty.html

“Il contenuto duplicato si riferisce generalmente a blocchi sostanziali di contenuto all'interno o tra domini che corrispondono completamente ad altri contenuti o sono sensibilmente simili. Per lo più, questo non è ingannevole in origine”.

Google
https://developers.google.com/search/docs/advanced/guidelines/duplicate-content

Nomenclatura, considerazioni ed errori da evitare

Ecco le principali considerazioni riguardanti la direttiva canonica, e le modalità per specificarla:

  • Un canonico può essere autoreferenziale, soprattutto in home page, in quanto può avere diversi access point generati dal CMS o dal server stesso (index.html, per citarne uno).
  • Un canonico deve essere utilizzato ogni volta che ci sono due contenuti simili, duplicati o, in altre parole, totalmente o parzialmente identici. In caso contrario, questo tag può essere ignorato.
  • Un canonico deve puntare a un URL indicizzabile, che restituisce 200 OK e non contiene un tag noindex . Un'altra cosa degna di nota è che non dovremmo inviare un canonico a un URL irrilevante, perché verrà interpretato come un Soft 404.
  • Dovrebbe esserci solo un canonico univoco per ogni URL. Se sono presenti due diversi tag canonici, potrebbero scontrarsi ed entrambi finiscono per essere ignorati.
  • Un canonico può utilizzare URL assoluti e relativi. Tuttavia, è importante sottolineare che gli URL relativi sono soggetti a errori e sviste.
  • Un tag canonico può essere ignorato se sono presenti errori evidenti, in termini di ortografia o altri errori non intenzionali. Potrebbero esserci altri segnali, che verranno analizzati per determinare se un tag canonico deve essere rispettato o ignorato.
  • Un tag canonico può anche essere ignorato se stiamo inviando segnali confusi, come fare riferimento a un tag canonico da url1 a url2 e quindi da url2 a url1. Incorrere in questo tipo di "loop" può portare a comportamenti imprevisti.
  • Un canonico può essere cross-domain, cioè punto da dominio1 a dominio2. Dovrebbe essere utilizzato, preferibilmente, quando abbiamo il controllo su entrambi i domini e vogliamo favorire l'indicizzazione di un dominio rispetto all'altro per evitare doppiezza. Sii cauto con questo.
  • Un altro esempio può essere la distribuzione dei contenuti.

A condizione che risolva situazioni di contenuto duplicato tra le pagine, alcuni dei casi più tipici in cui dovremo occuparci di questo sono:

  1. URL con www e URL senza www
  2. URL con http e URL con https
  3. URL che terminano con / vs URL che non terminano con / (senza contare la home page)
  4. URL con parametri e URL senza parametri (come URL con ID sessione).
  5. URL con impaginazione vs URL senza impaginazione
  6. URL con AMP e URL senza AMP (come markup obbligatorio).
  7. URL mobili (m-sites) e URL desktop
  8. URL pre (staging) vs URL di produzione (di produzione) (comunque, è meglio tenere Google fuori dallo staging per HTTP-Login)
  9. Eccetera.

Sebbene tutte queste situazioni possano essere risolte utilizzando i tag canonici, esiste un altro metodo più diretto per Google: reindirizzamento 301 .

Leggerai molti confronti di tag 301 e canonici. Non approfondiremo troppo, ma sottolineeremo i punti più importanti su questo argomento nell'immagine qui sotto:

301 vs canonico

Utilizzando questo riepilogo visivo, vogliamo evidenziare le seguenti cose:

  • Il reindirizzamento 301 unisce due parti di contenuto, il che significa che il contenuto originale cessa di esistere. È diretto e seguito al 100% da Google (e dagli utenti).
  • Il canonico, quello che fa, ci permette di mantenere disponibili vari URL per qualsiasi canale, e se Google rispetta la direttiva, solo l'URL canonizzato verrà indicizzato per il canale SEO.
  • Entrambi possono eventualmente comportare una diluizione del segnale e potrebbe avere un effetto più significativo quando non utilizziamo un reindirizzamento 301, poiché gli URL canonizzati possono avere collegamenti interni ed esterni che puntano ad essi, costringendoci a dividere i nostri sforzi tra diversi URL.

Procedure di attuazione

Esistono diversi modi per implementare i tag canonici:

tag HTML

Il modo più comune per implementare un canonico è inserire un elemento link con l'attributo rel="canonical" e il percorso assoluto della versione canonica all'interno del <head> di ogni URL. Ecco la sintassi corretta:

 <link rel="canonical" href="https://www.sistrix.com/ask-sistrix/what-is-the-canonical-tag-and-how-to-use-it/" />

Intestazione HTTP

Questo metodo viene normalmente utilizzato su pagine non HTML. Ad esempio: file PDF, XML o TXT.

Questo è il metodo tipico utilizzato, quando abbiamo sia un PDF che una pagina HTML corrispondente. Attraverso il canonico possiamo mostrare a Google che vogliamo che la pagina HTML si classifichi.

Tuttavia, data la varietà di casi diversi che possono esserci, consigliamo questo post, coprendo l'implementazione più tecnica attraverso il file .htaccess.

 <Files "seo-guide.pdf"> Header add Link "< http://www.sistrix.com/seo-guide/ >; rel=\"canonical\"" </Files>

Altri segnali: mappa del sito e link interni

In questo caso non implementeremo la direttiva canonica, ma affermiamo, implicitamente, che questo URL (al contrario delle sue altre versioni) è quello originale e ha più peso e valore.

Qualcosa di semplice come aggiungere URL a una mappa del sito o collegare un URL dalla navigazione del sito Web ha già un'importanza tacita e implicita , quindi stiamo praticamente inviando un segnale SEO sull'importanza di questa versione di URL per noi. Se ci contraddiciamo o ci sono altri segnali ambigui o inconcludenti, violeremo la legge della semplicità in SEO : non complicare Google le cose di quanto non lo sia già.

  • Con 2 URL duplicati, utilizzando canonicals, l'URL originale verrà incluso nella mappa del sito, il canonicalizzato no.
  • Con 2 URL duplicati, utilizzando canonicals, l'URL originale sarà collegato in modo visibile, il canonizzato non lo sarà (sebbene ciò non sia sempre possibile e l'URL canonizzato potrebbe avere qualche collegamento che punta ad esso).

Effetti e casi SEO

L'impatto maggiore che l'uso di canonical può avere è che, una volta rispettato da Google, l'URL a cui punta il tag canonical diventa indicizzabile e colui che emette il canonical si dimetterà e si sacrificherà, in modo che il contenuto più originale possa ottenere indicizzato.

D'altra parte, se l'URL che emette il canonico riceve collegamenti interni da qualche parte all'interno della struttura di navigazione, Google sarà in grado di eseguire la scansione di questa pagina e investire tempo su di essa . Questo dovrebbe farci seriamente pensare al nostro uso combinato di Robots.txt (anche "noindex") e canonico. Se vogliamo risparmiare il nostro crawl budget, è possibile che impediamo a Google di capire dove si trovano il duplicato e il suo canonico.

Parlando di casi più particolari, possiamo specificare un po' di più:

  • Parametri passivi : vengono utilizzati a scopo precauzionale, in combinazione con la gestione dei parametri di Google Search Console. Tuttavia, questi parametri vengono utilizzati per taggare le campagne (a pagamento, email, social...).
  • Parametri attivi : lingua, filtri. La chiave qui è identificare quali hanno contenuto minimamente originale che possiamo posizionare, oltre a sapere con certezza se rispondono o meno a un intento di ricerca. Ulteriori problemi possono essere i collegamenti interni e lo spreco di autorità attraverso i collegamenti interni di questi filtri.
  • Impaginazione : lo scenario attuale per quanto riguarda l'impaginazione è ancora una controversia in sé e per sé. Google ha rimosso la linea guida rel prev rel next e ora il mondo SEO sta discutendo se dovremmo usare noindex, un canonico per la prima pagina, lo scorrimento infinito o tecnologie dinamiche come AJAX per mantenere la funzionalità per l'utente senza generare nuove pagine/collegamenti, a seconda del caso. Non è affatto una decisione banale.
  • Pagine di prodotti con attributi simili (colore, dimensione) : analogamente a quanto detto sui filtri, dobbiamo identificare quando il loro contenuto non è minimamente originale per classificare e dobbiamo sapere se rispondono a un intento di ricerca. Si tenga presente la regola del “ciò che non si cerca non va indicizzato” .

Come analizzare o controllare i tag canonici

Ora, passiamo al business di come identificare o controllare i tag canonici. Abbiamo metodi per soddisfare le preferenze di tutti:

Esplora il codice sorgente

Visita la pagina e fai clic con il pulsante destro del mouse in un punto qualsiasi della pagina per visualizzare il menu con l'opzione "Visualizza sorgente pagina" (Control + U se stai utilizzando Windows; CMD + Alt + U se stai utilizzando Mac).

Esempio di codice sorgente

Una volta dentro, premi Control + F su Windows o CMD + F su Mac per cercare all'interno del codice. Digita “canonical”, in modo che il tag venga evidenziato con un colore diverso, se presente. Confrontarne il contenuto e determinare se questo valore è stato definito correttamente o meno.

Strumenti per sviluppatori di Chrome

Utilizzando Chrome possiamo aprire il sito Web che vogliamo analizzare, fare clic con il pulsante destro del mouse sullo schermo e premere "Ispeziona". Questo aprirà gli strumenti di sviluppo, dove possiamo cercare il tag con Control + F o Cmd + F, proprio come abbiamo fatto nel punto precedente.

Strumenti per sviluppatori di Chrome

La principale differenza tra il codice sorgente della pagina e l'ispettore è che il secondo ha già eseguito il rendering della pagina e vediamo il contenuto al termine di questo processo (compresa l'esecuzione di JavaScript).

In alternativa possiamo utilizzare la console , andando nella scheda “Console” e inserendo il seguente comando:

 $$('link[rel="canonical"]')[0] 
Funzionalità della console dagli strumenti per sviluppatori di Chrome

Su Google Search Console

Google Search Console offre diversi modi per analizzare o controllare i tag canonici. Un modo per farlo è andare al rapporto "Copertura" , dove possiamo analizzare qualsiasi evento responsabile dell'esclusione di determinati URL dal suo indice. In questa sezione “Esclusi” , a volte possiamo trovare situazioni relative ai tag canonici, sia casi corretti che errati (interpretati correttamente e in modo errato). Indubbiamente, è il modo perfetto per iniziare a tirare il filo che ci aiuterà a identificare i problemi.

Copertura di Google Search Console

D'altra parte, abbiamo lo strumento di ispezione degli URL , che può fornire informazioni dettagliate sui tag canonici dei singoli URL. Possiamo richiederne la scansione e restituire il loro stato, soprattutto se c'è una differenza tra le nostre istruzioni e ciò che Google sceglie di interpretare.

Strumento di controllo URL di Google Search Console

Come analizzare i tag canonici utilizzando SISTRIX Toolbox Optimizer

Esistono diversi modi per analizzare i canonici utilizzando SISTIX Toolbox Optimizer.

Scansione e rilevamento degli avvisi

Essendo un crawler, Optimizer visiterà il tuo sito web per identificare opportunità di miglioramento, errori e altri aspetti di cui sarai informato in modo semplice e visivo, così non dovrai perdere tempo a elaborare i dati. Ecco un esempio relativo ai tag canonici, di cui lo Strumento per ottimizzare ti avviserà (se commetti un errore):

Avvertimento sul tag Canonical

Esplora URL: analizza i singoli URL

Questa funzione è simile allo strumento di ispezione degli URL di Google Search Console, il che significa che sarai in grado di valutare i singoli URL che sono stati scansionati nel tuo progetto Optimizer e visualizzare le informazioni per quell'URL specifico..

Esplora URL nell'ottimizzatore
1
2

Come puoi vedere, possiamo analizzare tutti gli aspetti in-page relativi a questo URL, link interni sia in entrata che in uscita, informazioni sul server, tag SEO, ed è qui che troverai anche l'implementazione canonica, che è l'argomento a portata di mano .

Analisi dei metadati nell'ottimizzatore

Modalità esperto

Passando alla sezione Modalità Esperto, possiamo accedere a tutti gli URL scansionati del nostro progetto e utilizzare più filtri per perfezionare la nostra ricerca. Nell'esempio seguente, ho incluso gli URL che contengono /products/ nei loro URL, ma non appartengono al mercato /en_gb/.

Filtri nella tabella degli URL

Inoltre, possiamo anche configurare le colonne della tabella per visualizzare i campi che ci interessano di più. Nel mio esempio, ho scelto di mostrare codici di stato, livello di profondità, link interni, meta robot e canonical, ma potremmo anche aggiungere, semplicemente selezionando la loro casella: il titolo, la descrizione, H1, la dimensione, il tipo di contenuto, ecc.

immagine dall'ottimizzatore SISTRIX