Contenu dupliqué, curation et - Qu'est-ce qu'un Rel=Canonical ?
Publié: 2014-05-19 C'est un monde froid et dur pour un moteur de recherche. Les gens vous demandent des conseils; vous numérisez des millions de pages pour eux, leur donnez les meilleurs résultats que vous pouvez trouver, et ils ne disent jamais merci. Vous êtes traité comme un fonctionnaire, ignoré jusqu'à ce qu'ils aient à nouveau besoin de vous. (Renifler.)
Pourtant, c'est un monde de moteur-manger-moteur. Vous avez un travail à faire et vous allez le faire de votre mieux. Cela signifie beaucoup lorsque les gens se tournent vers vous plutôt que les autres, et pour garder leur confiance, vous devez continuer à vous améliorer tout le temps, dépasser les autres moteurs de recherche et fournir les résultats les plus savoureux.
Certains spécialistes du marketing de contenu sont doués pour l'optimisation, vous aidant avec du texte alternatif sur les photos, un contenu significatif et des métadonnées qui clarifient parfaitement le sujet de la page. Lorsque vous pouvez fournir exactement ce qu'un chercheur demande, c'est une sorte d'élégance, comme la pirouette exécutée perfectionnée d'un danseur ou attraper la meilleure vague de tous les temps au bon moment. Un plaisir presque physique. Si vous aviez un corps, vous marcheriez un peu plus grand.
Vous êtes un maître dans l'art de détecter les nuances entre les pages. Comme un limier, vous reniflez les vrilles de sens qui vous aident à trier une page A d'une page A+. Et grâce à la formation et au temps, vous avez développé la capacité de dire souvent quand quelqu'un essaie de vous manipuler. Lorsque vous découvrez que quelqu'un joue avec votre système, vous avez un atout à jouer : vous pouvez choisir de ne pas afficher ce site dans les résultats de recherche, afin qu'il ne puisse plus tromper ou décevoir un chercheur avide.
Il y a un hic que les spécialistes du marketing de contenu pourraient résoudre pour vous et eux-mêmes, un problème souvent créé par des personnes honnêtes souhaitant partager du bon contenu qui, ironiquement, vous pose un problème inutile : le contenu dupliqué . D'accord, nous allons dire au monde à ce sujet pour vous.
Pourquoi le contenu dupliqué est un problème
( Mise en garde : ce qui suit est une simplification de haut niveau du contenu dupliqué, destinée à fournir des informations très basiques au spécialiste du marketing qui crée du contenu. Si vous êtes un praticien SEO actif, il existe de nombreux problèmes de contenu en double (tels que les paramètres d'URL et les identifiants de session, etc.) que cet article n'aborde pas du tout . Pour les plus avancés , nous suggérons le guide des meilleures pratiques de Moz, « Qu'est-ce que le contenu dupliqué ? »
Le « contenu en double » est un problème créé lorsqu'un site Web héberge deux pages de contenu identiques ou presque, ou lorsque deux sites Web (ou plus) hébergent une page de contenu pratiquement identique. Voici une illustration du type de problèmes que cela cause :
Le site A a publié une belle biographie de 600 mots de la troisième épouse de Charles Dickens. Le site B a voulu partager la biographie avec ses lecteurs et a demandé la permission de la publier sur le blog du site B. Permission accordée. Le site B a publié l'article sur son propre site. La copie était la même, mais le billet de blog avait un titre légèrement différent et son URL était différente.
- L'URL de la page du Site A est la suivante : www.sitea.com/Dickens-third-wife-ran-coffee-shop.
- L'URL de la page du Site B est la suivante : www.siteb.com/Dickens-beloved-third-wife-Althea-ran-coffee-shop.
Vous, cher lecteur, demandez à votre téléphone : "Qui était la troisième épouse de Charles Dickens, et que lui est-il arrivé ?"
Si le moteur de recherche détermine que la biographie de 600 mots est la meilleure réponse à votre demande, le moteur ne sait pas s'il doit choisir la page du site A ou du site B pour revenir. Il renifle toutes les différences (peut-être que l'autorité du site l'aidera à décider), mais essentiellement, il est dans un dilemme. Ce n'est pas un bon endroit pour qu'un moteur de recherche occupé se bloque, et le moteur en sera vexé.
Google et les autres moteurs n'aiment pas le contenu en double car cela rend leur travail plus difficile et interfère avec leur capacité à renvoyer les meilleurs résultats. (Retourner de bons résultats est la façon dont les moteurs de recherche croissent et décroissent dans notre affection, donc comment ils peuvent facturer la publicité - comment ils vivent et meurent.) Et lorsqu'ils trouvent du contenu en double sur vos pages, ils ont le pouvoir d'exprimer ce mécontentement en ignorant vous, rendant ainsi votre site Web plus difficile à trouver - ce qui met un frein majeur à vos efforts de marketing entrant.
Rendre simple et facile pour un moteur de recherche de trouver et d'évaluer votre contenu s'appelle "l'optimisation des moteurs de recherche". Il n'y a pas de terme commun pour le contraire du référencement, mais peut-être qu'il devrait y en avoir. (Suggestions bienvenues.)
Dupliquer le contenu sur votre ou vos propres sites
La solution à cela est facile. Il n'y a jamais de bonne raison pour dupliquer du contenu sur votre propre site. Chaque page doit avoir sa propre histoire unique à raconter, et deux pages ne doivent pas raconter exactement la même histoire. Supposons que vous éleviez et vendiez des Yorkshire terriers et que votre objectif soit d'amener les gens à choisir un Yorkie plutôt qu'une autre race. Vous n'avez besoin que d'une seule page qui se concentre sur la disposition adorable de la race. Cette disposition peut être mentionnée sur d'autres pages, mais chaque page doit avoir son propre objectif (comment s'entraîner, quoi nourrir, durée de vie, historique, comment acheter, etc.). Ces autres pages peuvent mentionner le tempérament et faire un lien vers la page sur la disposition ; c'est une bonne chose pour le lecteur, et c'est donc aussi bon pour le référencement.
Si vous avez plusieurs sites et que vous avez du contenu qui serait bon sur tous les sites, vous pouvez le publier sur tous ; lisez la suite et portez une attention particulière à l'information « rel=canonical » à la fin.
Duplication par fermes de contenu
Il est encore courant que les « fermes de contenu » récupèrent une bonne histoire sur le Web et la tournent, mécaniquement ou autrement. Le but est de raconter la même histoire (et d'obtenir la même valorisation du contenu) tout en changeant juste assez pour que les moteurs de recherche ne le reconnaissent pas comme un contenu dupliqué. C'est une forme de plagiat, une technique de chapeau noir, et les moteurs de recherche bondiront s'ils le découvrent. (Bravo !) Si vous engagez une agence quelconque pour vous aider à créer du contenu, assurez-vous qu'elle ne détourne pas le contenu des autres. Si une copie dupliquée est trouvée sur votre site, c'est vous qui paierez la pénalité, peu importe l'innocence avec laquelle vous l'avez achetée ou la personne que vous avez embauchée pour la créer pour vous. (À part : un bon contenu coûte du temps, de l'argent ou les deux ; il n'y a pas de véritables raccourcis. Acheteur, méfiez-vous.)
La curation ne doit pas être une duplication
Parfois, vous trouvez une histoire si intelligente, utile ou bien écrite que vous souhaitez la partager. Vous pouvez toujours attirer l'attention dessus dans un tweet ou une publication sur Facebook (en l'attribuant à son auteur, bien sûr). Si vous le republiez simplement, ce partage innocent peut commencer comme une forme d'appréciation… mais se terminer par un contenu dupliqué. Si vous souhaitez organiser le contenu de quelqu'un, c'est une forme de partage bienvenue tant que vous le faites correctement. Les règles (non écrites) sont :

- Ne partagez que ce que vous savez que vos propres lecteurs apprécieront de trouver.
- Ne republiez pas toute l'histoire. Choisissez des extraits ou quelques paragraphes.
- Donnez crédit à l'auteur ou au site d'origine, et créez un lien vers le contenu original.
- Inclure votre propre opinion. Avoir quelque chose d'unique à dire ; c'est ce qui signifiera vraiment que votre pièce est une œuvre originale. Vos propres mots devraient former la majeure partie de l'article.
- C'est bien, et de bonnes manières (si ce n'est toujours strictement pratique ou nécessaire) de contacter d'abord l'auteur et de lui faire savoir que vous organisez son article. Les personnes ayant un demi-million d'abonnés ou de colonnes dans les grands journaux peuvent ne pas répondre, mais les personnes bien connues dans leur domaine (sinon exactement des personnalités publiques) peuvent le faire, et elles l'apprécieront souvent.
Considérez-le comme une critique de livre : vous ajoutez de la valeur en attirant l'attention sur le livre, et vous ajoutez de la valeur avec votre commentaire. Vous ne réimprimez pas le livre (mais vous créez un lien vers celui-ci afin que les gens puissent facilement le trouver et le lire).
Qu'est-ce qu'un rel=canonique ? – et pourquoi vous devriez vous en soucier
Tôt ou tard, il y aura un article ou un article de blog que vous souhaitez essentiellement réimprimer dans son intégralité. Peut-être que quelqu'un vient de dire quelque chose de si parfaitement que vous ne voulez pas le couper et le conserver - vous voulez republier le tout, tel quel, pour le bénéfice de vos lecteurs. Ou peut-être avez-vous écrit un article invité pour un autre site Web ou blog et souhaitez-vous que vos propres lecteurs le voient. Vous pouvez le faire sans risquer la colère de contenu dupliqué de Google (et alia) en utilisant une balise rel=canonical dans les métadonnées de l'article republié.
Vous pouvez considérer un rel=canonical comme une direction d'URL vers une page "canonique". Un « canon » est un principe fondamental, une norme acceptée, la base essentielle de quelque chose, etc. Une page « canonique » est la page source essentielle, originale ; "rel=" signifie "relation". Ainsi, rel=canonical signifie essentiellement "la version canonique de cette page se trouve à cette adresse URL". (Des informations plus détaillées sur les liens canoniques peuvent être trouvées ici.)
La plupart des pages Web ont déjà un rel=canonical dans leurs champs de métadonnées. La valeur par défaut est généralement l'URL de la page Web. Si vous utilisez un système de gestion de contenu, il est probable que rel=canonical soit une balise standard et utilise par défaut la propre URL de la page.
Récemment, Ricky Bandelin de Industrial Quality Management a écrit un bon article invité sur la délivrabilité que nous avons publié sur le blog Marketing Action d'Act-On. Voici à quoi ressemble le rel=canonical dans le code source sur notre site :
Ricky a également publié l'article sur son propre site. Notez que si la plupart de son code source est différent, le rel=canonical est le même que sur le blog d'Act-On. Il dit à Google (ou à n'importe quel moteur de recherche) que le contenu original est là-bas , à cette URL Act-On. Il se comporte comme une sorte de redirection pour Google (et.al.).
Supposons maintenant que quelqu'un recherche canard + délivrabilité + e-mail. Google peut regarder les deux pages et savoir laquelle renvoyer. La page Web affichant le blog Act-On sera celle montrée au chercheur car dans les deux endroits où ce contenu vit, tout le monde s'accorde à dire que la page du blog Act-On est la page canonique.
Pour revenir à notre exemple de la biographie de 600 mots de Mme Dickens :
L'URL de la page du Site A est www.sitea.com/Dickens-third-wife-ran-coffee-shop. Le rel=canonique est :
- <link rel="canonical" href="https://sitea.com/Dickens-third-wife-ran-coffee-shop/" />
L'URL de la page du Site B est www.siteb.com/Dickens-beloved-third-wife-Althea-ran-coffee-shop. Mais le rel=canonical est le même maintenant que celui du site A :
- <link rel="canonical" href="https://sitea.com/Dickens-third-wife-ran-coffee-shop/" />
Les moteurs de recherche savent exactement quelle page renvoyer ; il n'y a pas de problèmes pour eux. Et le spécialiste du marketing de contenu du site B peut montrer à ses lecteurs un excellent contenu sans risque de contenu dupliqué. .
Configurer un lien rel=canonical dans un système de gestion de contenu
Vous n'avez pas besoin d'être un assistant de code pour configurer cela. Nous utiliserons un article de blog comme exemple.
Si vous utilisez WordPress et Yoast :
1. Préparez votre brouillon d'article de blog dans WordPress
2. Accédez à la page Web de la publication ou de l'article que vous souhaitez republier ; copier l'url
3. Revenez à votre brouillon dans votre application WordPress
4. Cliquez sur "Avancé" dans le panneau SEO
5. Dans le panneau qui s'ouvre, faites défiler jusqu'au champ URL canonique.
6. Saisissez l'URL que vous avez copiée. Le plug-in Yoast ajoutera le bit rel= pour vous
Pour les autres systèmes de gestion de contenu, il existe souvent un champ rel=canonical similaire ou son équivalent.
S'il n'y a pas de champ évident, vous pouvez créer un lien rel=canonical dans le code source de votre page.
Mettre en place un rel=canonical directement dans le code source
1. Configurez votre article de blog en tant que brouillon
2. Rendez-vous sur la page avec le contenu que vous souhaitez republier
3. Faites un clic droit et choisissez "Afficher la source de la page"
4. Sur la page, recherchez la balise meta rel=canonical
5. Copiez toute la séquence de balises
Cela devrait ressembler beaucoup à ceci :
<link rel="canonical" href=" https://www.what-ever-the-text-actually-is/ " />
6. Remplacez votre propre balise rel=canonical par celle que vous avez copiée
Désormais, lorsque vous publierez cette publication, vos métadonnées indiqueront à Google où se trouve la version canonique de cette page. Toutes nos félicitations; vous venez de faire le bonheur d'un moteur de recherche. Et c'est une bonne chose.
Pour plus d'informations sur rel=canonical, consultez le post de Google " 5 erreurs courantes avec Rel=Canonical ".
Pour plus d'informations sur le référencement de base, lisez SEO 101 : Les bases et au-delà
NB : La photographie est en fait celle de Catherine Hogarth Dickens, la seule et unique épouse de Charles Dickens.