Apa itu tag kanonik dan bagaimana menggunakannya?

Diterbitkan: 2022-04-17
Isi
Isi

Definisi dan artinya

Tag kanonik adalah elemen HTML yang kami gunakan untuk memberi tahu Google bahwa 2 atau lebih URL di situs web kami adalah duplikat, serupa, atau identik.

Tag ini memungkinkan kita untuk 'memilih' mana dari beberapa URL yang harus ditampilkan di SERP, untuk membantu Google memutuskan halaman mana yang pada akhirnya harus ditampilkan dalam hasil. Dengan kata lain, kami memberikan sinyal kepada Google yang menunjukkan versi yang diinginkan untuk diindeks .

Selain memperkuat sinyal pengindeksan ini, ini juga mengkonsolidasikan tautan internal kami yang menunjuk dari URL asal ke URL kanonik target.

Berkenaan dengan duplikat konten dan berbagai mitos yang beredar di industri ini, tidak ada cara yang lebih baik untuk mengklarifikasinya selain dengan mengutip sumber resmi dan referensi yang berasal dari Google sendiri:

“Mari kita selesaikan ini sekali dan untuk semua, teman-teman: Tidak ada yang namanya “hukuman konten duplikat.” Setidaknya, tidak seperti yang kebanyakan orang maksudkan ketika mereka mengatakan itu. Anda dapat membantu sesama webmaster dengan tidak mengabadikan mitos tentang hukuman duplikat konten!”

Susan Moska
https://webmasters.googleblog.com/2008/09/demystifying-duplicate-content-penalty.html

“Konten duplikat umumnya mengacu pada blok konten substantif di dalam atau di seluruh domain yang benar-benar cocok dengan konten lain atau sangat mirip. Sebagian besar, ini tidak menipu asal. ”

Google
https://developers.google.com/search/docs/advanced/guidelines/duplicate-content

Nomenklatur, pertimbangan, dan kesalahan yang harus dihindari

Berikut adalah pertimbangan utama mengenai direktif kanonik, dan cara untuk menentukannya:

  • Sebuah kanonik dapat menjadi referensi sendiri, terutama di halaman beranda, karena dapat memiliki beberapa titik akses yang dihasilkan oleh CMS atau server itu sendiri (index.html, untuk menyebutkan satu).
  • Kanonik harus digunakan setiap kali ada dua bagian konten yang serupa, duplikat, atau, dengan kata lain, identik seluruhnya atau sebagian. Jika tidak, tag ini dapat diabaikan.
  • Kanonik harus mengarah ke URL yang dapat diindeks, mengembalikan 200 OK dan tidak membawa tag noindex . Hal lain yang perlu disebutkan adalah bahwa kita tidak boleh mengirim kanonik ke URL yang tidak relevan, karena akan ditafsirkan sebagai Soft 404.
  • Seharusnya hanya ada satu kanonik unik untuk setiap URL. Jika ada dua tag kanonik yang berbeda, mereka mungkin berbenturan dan keduanya akhirnya diabaikan.
  • Kanonik dapat menggunakan URL absolut dan relatif. Namun, penting untuk menunjukkan bahwa URL relatif rentan terhadap kesalahan dan pengawasan.
  • Sebuah tag kanonik dapat diabaikan jika ada kesalahan yang jelas, dalam hal ejaan atau kesalahan yang tidak disengaja lainnya. Mungkin ada sinyal lain, yang akan dianalisis untuk menentukan apakah tag kanonik harus dipatuhi atau diabaikan.
  • Tag kanonik juga dapat diabaikan jika kami mengirimkan sinyal yang membingungkan, seperti mereferensikan kanonik dari url1 ke url2, lalu dari url2 ke url1. Untuk menimbulkan "loop" semacam ini dapat menghasilkan perilaku yang tidak terduga.
  • Sebuah kanonik dapat lintas domain, yaitu titik dari domain1 ke domain2. Ini harus digunakan – sebaiknya – ketika kita memiliki kendali atas kedua domain dan kita ingin mendukung pengindeksan satu domain di atas yang lain untuk mencegah duplikasi. Hati-hati dengan ini.
  • Contoh lain adalah sindikasi konten.

Asalkan itu memecahkan situasi konten duplikat antar halaman, beberapa kasus paling umum di mana kita harus berurusan dengan ini, adalah:

  1. URL dengan www vs URL tanpa www
  2. URL dengan http vs URL dengan https
  3. URL yang diakhiri dengan / vs URL yang tidak diakhiri dengan / (tidak termasuk halaman beranda)
  4. URL dengan parameter vs URL tanpa parameter (seperti url dengan ID sesi).
  5. URL dengan pagination vs URL tanpa pagination
  6. URL dengan AMP vs URL tanpa AMP (sebagai markup wajib).
  7. URL seluler (m-situs) vs URL desktop
  8. URL pra (pementasan) vs URL prod (produksi) (bagaimanapun, lebih baik untuk menjauhkan Google dari pementasan adalah per HTTP-Login)
  9. Dll.

Meskipun semua situasi ini dapat diselesaikan menggunakan tag kanonik, ada metode lain yang lebih langsung untuk Google: 301 redirect .

Anda akan membaca banyak 301 dan perbandingan tag kanonik. Kami tidak akan membahasnya terlalu jauh, tetapi kami akan menekankan poin terpenting mengenai masalah ini pada gambar di bawah ini:

301 vs kanonik

Dengan menggunakan ringkasan visual ini, kami ingin menyoroti hal-hal berikut:

  • 301 redirect menggabungkan dua konten, yang berarti konten asli tidak ada lagi. Ini langsung dan 100% diikuti oleh Google (dan pengguna).
  • Kanonik, yang dilakukannya adalah memungkinkan kami untuk menyimpan berbagai URL yang tersedia untuk saluran apa pun, dan jika Google mematuhi arahan tersebut, hanya URL kanonik yang akan diindeks untuk saluran SEO.
  • Keduanya mungkin melibatkan pengenceran sinyal, dan itu bisa memiliki efek yang lebih signifikan ketika kami tidak menggunakan pengalihan 301, karena URL yang dikanonikalisasi dapat memiliki tautan internal dan eksternal yang mengarah ke sana, memaksa kami untuk membagi upaya kami di antara beberapa URL.

Prosedur pelaksanaan

Ada beberapa cara untuk menerapkan tag kanonik:

tag HTML

Cara paling umum untuk menerapkan kanonik adalah dengan menempatkan elemen tautan dengan atribut rel="canonical" dan jalur absolut ke versi kanonik di dalam <head> setiap URL. Berikut sintaks yang benar:

 <link rel="canonical" href="https://www.sistrix.com/ask-sistrix/what-is-the-canonical-tag-and-how-to-use-it/" />

tajuk HTTP

Metode ini biasanya digunakan pada halaman non-HMTL. Misalnya: file PDF, XML atau TXT.

Ini adalah metode umum yang digunakan, ketika kami memiliki PDF dan halaman HTML yang cocok. Melalui kanonik, kami dapat menunjukkan kepada Google bahwa kami ingin peringkat halaman HTML.

Namun demikian, mengingat berbagai kasus berbeda yang mungkin ada, kami merekomendasikan posting ini, yang mencakup implementasi yang lebih teknis melalui file .htaccess.

 <Files "seo-guide.pdf"> Header add Link "< http://www.sistrix.com/seo-guide/ >; rel=\"canonical\"" </Files>

Sinyal lain: peta situs dan tautan internal

Dalam hal ini kami tidak akan menerapkan direktif kanonik, tetapi kami menyatakan, secara implisit, bahwa URL ini (sebagai lawan dari versi lainnya) adalah yang asli, dan memiliki bobot dan nilai lebih.

Sesuatu yang sederhana seperti menambahkan URL ke peta situs, atau menautkan URL dari navigasi situs web sudah memiliki kepentingan diam- diam dan implisit , jadi kami cukup banyak mengirimkan sinyal SEO mengenai pentingnya versi URL ini bagi kami. Jika kami bertentangan dengan diri kami sendiri atau ada sinyal ambigu atau tidak meyakinkan lainnya, kami akan melanggar hukum kesederhanaan dalam SEO : jangan membuatnya lebih rumit untuk Google daripada yang sudah ada.

  • Dengan 2 URL duplikat, menggunakan kanonik, URL asli akan disertakan dalam peta situs, yang dikanonik tidak akan.
  • Dengan 2 URL duplikat, menggunakan kanonik, URL asli akan ditautkan dengan jelas, yang dikanonikalisasi tidak akan (walaupun ini tidak selalu memungkinkan, dan URL yang dikanonik mungkin memiliki beberapa tautan yang mengarah ke sana).

Kasus efek dan SEO

Dampak terbesar dari penggunaan canonical adalah setelah dihormati oleh Google, URL yang ditunjuk oleh tag canonical menjadi dapat diindeks , dan yang mengeluarkan canonical akan mengundurkan diri dan mengorbankan dirinya sendiri, sehingga konten yang lebih orisinal dapat mendapatkan diindeks.

Di sisi lain, jika URL yang menerbitkan kanonik menerima tautan internal di suatu tempat dalam struktur navigasi, Google akan dapat merayapi laman ini dan menginvestasikan waktu untuk itu . Ini seharusnya membuat kami berpikir tentang penggunaan gabungan Robots.txt (bahkan “noindex”) dan kanonik. Jika kami ingin menghemat anggaran perayapan kami, mungkin kami dapat mencegah Google memahami di mana duplikat dan letak kanoniknya.

Berbicara tentang kasus yang lebih khusus, kita dapat menentukan lebih banyak:

  • Parameter pasif : digunakan sebagai tindakan pencegahan, dalam kombinasi dengan manajemen parameter Google Search Console. Namun, parameter ini digunakan untuk menandai kampanye (berbayar, email, sosial…).
  • Parameter aktif : bahasa, filter. Kuncinya di sini adalah mengidentifikasi mana yang memiliki konten orisinal minimal yang dapat kita posisikan, selain mengetahui dengan pasti apakah mereka merespons maksud pencarian atau tidak. Masalah tambahan dapat berupa tautan internal dan pemborosan otoritas melalui tautan internal filter ini.
  • Pagination : skenario saat ini berkaitan dengan pagination masih menjadi kontroversi tersendiri. Google menghapus pedoman rel prev rel next, dan sekarang dunia SEO memperdebatkan apakah kita harus menggunakan noindex, kanonik ke halaman pertama, gulir tak terbatas, atau teknologi dinamis seperti AJAX untuk mempertahankan fungsionalitas bagi pengguna tanpa membuat halaman/tautan baru, tergantung kasusnya. Ini sama sekali bukan keputusan yang sepele.
  • Halaman produk dengan atribut serupa (warna, ukuran) : Mirip dengan apa yang kami katakan tentang filter, kami perlu mengidentifikasi kapan konten mereka tidak minimal asli untuk diberi peringkat, dan kami perlu tahu apakah mereka merespons maksud pencarian. Kita harus mengingat aturan "itu, yang tidak dicari, tidak boleh diindeks" .

Cara menganalisis atau mengaudit tag kanonik

Sekarang, kita masuk ke bisnis tentang cara mengidentifikasi atau mengaudit tag kanonik. Kami memiliki metode yang sesuai dengan preferensi semua orang:

Jelajahi kode sumber

Kunjungi halaman dan klik kanan di mana saja pada halaman untuk membuka menu dengan opsi "Lihat Sumber Halaman" (Control + U jika Anda menggunakan Windows; CMD + Alt + U jika Anda menggunakan Mac).

Contoh kode sumber

Setelah masuk, tekan Control + F di Windows atau CMD + F di Mac untuk mencari di dalam kode. Ketik "kanonik", sehingga tag menjadi disorot dalam warna yang berbeda, jika ada. Bandingkan isinya dan tentukan apakah nilai ini telah ditentukan dengan benar atau tidak.

Alat pengembang Chrome

Menggunakan Chrome, kita dapat membuka situs web yang ingin kita analisis, klik kanan pada layar, dan tekan "Periksa". Ini akan membuka alat pengembang, di mana kita dapat mencari tag dengan Control + F atau Cmd + F, seperti yang kita lakukan di poin sebelumnya.

Alat pengembang Chrome

Perbedaan utama antara kode sumber halaman dan pemeriksa, adalah bahwa yang kedua telah merender halaman dan kita melihat konten setelah proses ini (termasuk eksekusi JavaScript) selesai.

Atau, kita dapat menggunakan console , dengan membuka tab “Console” dan memasukkan perintah berikut:

 $$('link[rel="canonical"]')[0] 
Fitur konsol dari alat pengembang Chrome

Di Google Search Console

Google Search Console menyediakan berbagai cara untuk menganalisis atau mengaudit tag kanonik. Salah satu cara untuk melakukannya, adalah membuka laporan “Cakupan” , tempat kami dapat menganalisis peristiwa apa pun yang bertanggung jawab atas pengecualian URL tertentu dari indeksnya. Di bagian "Dikecualikan" ini , terkadang kita dapat menemukan situasi yang terkait dengan tag kanonik, baik kasus yang benar maupun yang salah (diinterpretasikan dengan benar dan salah). Tidak diragukan lagi, ini adalah cara sempurna untuk mulai menarik benang merah yang akan membantu kami mengidentifikasi masalah.

Cakupan Google Search Console

Di sisi lain, kami memiliki alat pemeriksaan URL , yang dapat memberikan wawasan tentang tag kanonik dari masing-masing URL. Kami dapat memintanya untuk merayapi mereka dan mengembalikan status mereka, terutama jika ada perbedaan antara instruksi kami dan apa yang dipilih Google untuk ditafsirkan.

Alat Inspeksi Url dari Google Search Console

Cara menganalisis tag kanonik menggunakan Pengoptimal Kotak Alat SISTRIX

Ada beberapa cara untuk menganalisis kanonik menggunakan Pengoptimal Kotak Alat SISTIX.

Perayapan dan deteksi peringatan

Sebagai perayap, Pengoptimal akan mengunjungi situs web Anda untuk mengidentifikasi peluang peningkatan, kesalahan, dan aspek lain yang akan diberitahukan kepada Anda dengan cara yang mudah dan visual, sehingga Anda tidak perlu membuang waktu untuk memproses data. Berikut adalah contoh yang terkait dengan tag kanonik, yang akan diberitahukan oleh Pengoptimal kepada Anda (jika Anda melakukan kesalahan):

Peringatan tentang tag Canonical

Penjelajah URL: analisis URL individual

Fitur ini mirip dengan alat pemeriksaan URL Google Search Console, yang berarti Anda akan dapat mengevaluasi setiap URL yang dirayapi dalam proyek Pengoptimal Anda dan melihat informasi untuk satu URL tersebut..

Penjelajah URL di Pengoptimal
1
2

Seperti yang Anda lihat, kami dapat menganalisis semua aspek di halaman terkait URL ini, baik tautan internal masuk dan keluar, informasi server, tag SEO, dan di sinilah Anda juga akan menemukan implementasi kanonik, yang merupakan subjek yang ada. .

Analisis Meta-Data di Pengoptimal

Mode ahli

Dengan masuk ke bagian Mode Pakar, kami dapat mengakses semua URL yang dirayapi proyek kami, dan menggunakan beberapa filter untuk mempersempit pencarian kami. Dalam contoh di bawah ini, saya telah menyertakan URL yang berisi /products/ di URL-nya, tetapi bukan milik pasar /en_gb/.

Filter di tabel URL

Selain itu, kami juga dapat mengonfigurasi kolom tabel untuk menampilkan bidang yang lebih kami minati. Dalam contoh saya, saya telah memilih untuk menampilkan kode status, tingkat kedalaman, tautan internal, robot meta, dan kanonik, tetapi kami juga dapat menambahkan –dengan sederhana mencentang kotaknya– judul, deskripsi, H1, ukuran, jenis konten, dll.

gambar dari SISTRIX Optimizer