Paginare și canonizare pentru profesioniști – SMX Advanced 2012

Publicat: 2012-06-07

Despre ce este această sesiune techy? Iată descrierea de pe ordinea de zi:

Utilizarea etichetei de paginare cu parametri opționali, ordine de sortare și filtre. Mai există motive pentru a utiliza robots.txt sau noindex? Poate o etichetă canonică să înlocuiască cu adevărat un 301? Cum vă păstrați site-ul bazat pe IIS de bucle de redirecționare infinite atunci când canonizați numele de pagini implicite? Și cum rămâne cu rel=alternate href=lang? Vom parcurge problemele pas cu pas, astfel încât să puteți elimina dezordinea de pe site-ul dvs., să maximizați accesarea cu crawlere și indexarea și să eliminați riscurile de conținut duplicat.

Moderator: Vanessa Fox, editor colaborator, Search Engine Land (@vanessafox)
Moderator de întrebări și răspunsuri: Eric Enge, CEO, Stone Temple Consulting (@stonetemple)
Difuzoare:
Adam Audette, președinte, RKG (@audette)
Jeff Carpenter, Manager SEO, PETCO (@SanDiegoSEO)
Maile Ohye, inginer senior de programe pentru dezvoltatori, Google Inc. (@maileohye)

Vanessa salută publicul și spune că vor fi multe timpuri de întrebări. Adam Audette începe prezentările. El este foarte încântat să iasă. E drăguț.

Paginare Dos și Dont

Cel mai bun mod de a te gândi la asta: „Totul ar trebui făcut cât se poate de simplu, dar nu mai simplu.” – Einstein

Exemplu: Zales, un site mare de comerț electronic. Aveți diferite tipuri și pagini de produse. Pe baza sortării, vizualizarii paginii și paginii, există o mulțime de oportunități de confuzie în accesarea cu crawlere. Peste 100 de rezultate duplicate, ușor.

Este asta mare lucru? Da, mai ales după Panda – fără duplicare asemănătoare.

Cum să gestionezi asta?

Metoda de paginare Noindex: paginile noindex, urmați. Problema este să le faci târâi
Adnotări:
paginile 2-N adnotate cu noindex, urmați
paginile 2-N auto-referențiere rel canonical
paginile 2-N conțin titluri unice, adrese URL și metadate

Rel prev/next Tehnica de paginare: puțin mai greu de implementat. În cazul în care noindex a transmis un fel de capital la pagina 1 pentru a fi candidatul clasat, rel next/prev reunește paginile într-o serie.

Paginile mai profunde sunt încă în index, pot fi scoase cu un site: căutați și apar atunci când Google consideră că este un rezultat relevant. Când rel canonical este auto-referință, este adecvat, dar când este folosit pentru a indica pagina 1, există un semnal conflictual.

Vedeți toate cerințele de paginare
Adnotări:
paginile 2-N specificați View All ca țintă canonică rel
O soluție elegantă
View Alls tind să convertească mai bine

Vanessa explică că un scroll infinit AJAX pentru afișarea produselor este, de asemenea, o experiență bună pentru utilizator.

Ambele Quora și Twitter fac această metodă de încărcare și reîmprospătare continuă. Googlebot primește primele 500 de cuvinte. Este o problemă potențială dacă doriți ca conținutul să fie accesat cu crawlere.

Recomandări:
Când ai o vizualizare excelentă, aceasta este calea elegantă
Când View All nu este o opțiune, utilizați rel next/prev
Încă două opțiuni: adăugați parametri la RL cu un #hash și randare progresivă pe măsură ce utilizatorii derulează

SEO pentru navigații cu fațete

Dacă este selectată o fațetă, clasificați-o ca fiind importantă pentru utilizatori, dar nu SEO sau importantă pentru SEO. Tratați diferit pentru fiecare situație. Forțați aceeași cale canonică pentru URL, indiferent de modul în care sunt selectate.

Dezavantaje:
nu rezolvă nimic pentru scăderea supraîncărcărilor cu crawl
intensivă în muncă și predispusă la erori

Common rel canonical gotcha: duplicarea referințelor necanonice canonice la sine atunci când există o versiune canonică reală. Aceasta este cea mai frecventă problemă cu care se confruntă.

Concluzii:
Utilizați rel canonical pentru a semnala adresa URL preferată, nu ca o comandă rapidă
Semnalele legăturii interne ar trebui să fie consistente
Atenție la auto-referințare rel canonical

Jeff Carpenter este următorul. Are un studiu de caz pe Petco.com. Cantitate mare de duplicare bazată pe categorizare. Fiecare subcategorie avea o mulțime de opțiuni de rafinare. O reproiectare a site-ului categorii rectegorizate și structura de navigare și URL modificată.

Soluţie:
Reduceți opțiunile de rafinare. Analiza revizuită pentru a vedea rafinamentările care sunt utilizate și nu. Au trecut de la 50 de rafinamente la 12.
Educație transversală. Educația între departamente a dus la promovarea unor formate URL unificate
Implementați etichete canonice pentru a se potrivi cu navigarea generată dinamic pe site. A creat formate URL uniforme și a îmbunătățit datele de analiză.
Utilizați noindex, urmăriți pe toate paginile de paginare, reducând potențialul de probleme de conținut duplicat pe site.

Rezultate:
Creștere cu 13+% a ratei de conversie din căutarea naturală în 6 luni
Cantitate redusă de pagini cu valoare redusă în SERP-uri
Clasamentul general a crescut – o îmbunătățire cu aproximativ 20% a frazelor monitorizate în 2 luni
Direcționați traficul SERP către paginile cu lista de produse

Maile va oferi o îmbrățișare de grup, explicând modul în care conferința i-a oferit ei și echipei ei feedback util. Vorbind aici a fost benefic pentru ei la Google. În 2009, ea a avut o sesiune despre duplicare și a lucrat cu probleme de sculptare PageRank – distracție. În 2012, un panou a adus în discuție probleme de navigare cu fațete. În 2011, au lansat un instrument îmbunătățit pentru parametrii URL.

În 2011, un panou cu REI a adus în discuție probleme de paginare, încercând să folosească rel canonical pentru conținut neduplicat, ceea ce nu era ceea ce au vrut. Asistența Google rel next/prev a fost lansată 5 luni mai târziu. Ajută Google să identifice mai multe secvențe decât poate detecta singur.

Parametrii URL în Instrumentele pentru webmasteri

Își cere scuze pentru că postarea de pe blog și articolul din Centrul de ajutor nu sunt atât de detaliate pe cât ar fi putut fi.

Ajută la înțelegerea parametrilor pentru a accesa site-ul mai eficient
Explorați-vă site-ul mai eficient
Economisește lățime de bandă
Ajută la indexarea conținutului proaspăt mai unic
Pentru eliminări, accesați Eliminarea adreselor URL în WMT

Markup la nivel de pagină aplicat separat după accesarea cu crawlere a paginii și luat în continuare în considerare
Parametrii URL pot fi un indiciu util și nu sunt directive

Este o caracteristică avansată. Uneori, site-urile au deja o acoperire mare de accesare cu crawlere, așa cum este stabilit de Google. Acțiunile necorespunzătoare pot duce la ca paginile să nu apară în rezultatele căutării.

Problemă: crawling ineficient
Adrese URL eligibile: cheie=valoare&key2=valoare 2

Pasul 1: Specificați parametrii care nu modifică conținutul
1. Am parametri care nu afectează conținutul paginii (sessionID, affiliateID, trackingID)?
Marcați probabil ca „nu modifică conținutul”.

Pasul 2a: Specificați parametrii care modifică conținutul
Pasul 2b: specificați comportamentul preferat al Googlebot

Parametrul de sortare modifică conținutul comenzii prezentat.
1. Este parametrul de sortare opțional pe întregul site?
2. Poate Googlebot să descopere tot ce este util atunci când parametrul de sortare nu este afișat?

Dacă da la ambele, probabil că, împreună cu parametrul dvs., puteți specifica „Crawl No URLSs”.

Verificați că exemplele afișate nu sunt canonice și că acestea pot fi accesate prin navigare.

Sau aceleași valori de sortare la nivelul întregului site?
1. Sunt aceleași valori de sortare utilizate în mod consecvent pentru fiecare categorie?
2. Când un utilizator modifică valoarea de sortare, numărul total de articole rămâne neschimbat?

Dacă da, probabil că cu parametrul dvs. de sortare puteți specifica „doar adrese URL cu valoarea x”, unde x este una dintre valorile de sortare utilizate pe întregul site.

Narrows filtrează ocntența din pagină afișând subsetul de articole totale.

Dacă parametrul de restrângere arată conținut mai puțin util, care este un subset al conținutului de la adresa URL fără parametrul de restrângere, este posibil să puteți specifica „Fără URL-uri accesate cu crawlere”.

Verificați de două ori verificând dacă adresele URL afișate în exemplu oferă conținut redundant.

Parametrul specificat determină conținutul afișat pe o pagină.

Parametrul traduce, cu excepția cazului în care doriți să excludeți accesul cu crawlere/disponibil în anumite limbi în rezultatele căutării, specificați „Accesați cu crawlere fiecare adresă URL”. Cea mai bună practică de a plasa limbile în subdirector sau subdosar, mai degrabă decât în parametri, pentru a ajuta motoarele de căutare să înțeleagă mai ușor structura site-ului.

Paginations afișează o pagină componentă a unei secvențe de mai multe pagini. Utilizați Accesați cu crawlere fiecare adresă URL.

Dar mai mulți parametri într-o singură adresă URL? Imaginează-ți că toate adresele URL încep ca eligibile pentru accesare cu crawlere, apoi aplică fiecare setare ca un proces de eliminare, nu de includere.
Dacă vreun parametru din adresa URL se potrivește cu o setare de parametri URL, dacă setarea de potrivire a specificat accesul cu crawlere Fără URL, atunci nu accesați cu crawlere. Dacă URL-ul ajunge până la capăt, este accesat cu crawlere.

Cele mai bune practici:
Linkurile interne ar trebui să includă numai adrese URL canonice
Listați canonicalele în Sitemaps
Ajută la promovarea canonică
Oferă numărări de indici mai precise
Markupul de indexare a paginii este încă util. rel canonical, rel next/prev poate fi folosit în tandem.
Utilizați parametrii URL pentru accesarea cu crawlere mai eficientă