重复的内容、策展和 – 什么是 Rel=Canonical?
已发表: 2014-05-19
对于搜索引擎来说,这是一个寒冷、艰难的世界。 人们向你寻求指导; 你为他们扫描数百万页,给他们你能找到的最好的结果,他们从不说谢谢。 你被当作工作人员对待,被忽视,直到他们再次需要你。 (闻。)
尽管如此,这是一个引擎吃引擎的世界。 你有工作要做,你会尽力而为。 当人们转向你而不是其他人时,这意味着很多,为了保持他们的信任,你必须一直变得更好,超越其他搜索引擎,并提供最好的结果。
一些内容营销人员擅长优化,通过照片上的替代文本、有意义的内容和元数据帮助您完全清楚页面的内容。 当您能够准确地提供搜索者所要求的内容时,这就是一种优雅,就像舞者完美执行的旋转动作或恰好在正确的时间捕捉有史以来最好的波浪一样。 几乎是肉体上的愉悦。 如果你有身体,你会走得更高一点。
您是检测页面之间细微差别的高手。 就像猎犬一样,您会嗅探意义的卷须,帮助您从 A+ 页面中排序 A 页面。 通过训练和时间,你已经具备了经常分辨出有人试图操纵你的能力。 当您发现有人在玩弄您的系统时,您确实有一张王牌可以打:您可以选择不在搜索结果中显示该网站,这样它就不会再次愚弄或让热切的搜索者失望。
内容营销人员可以为您和他们自己解决一个问题,这个问题通常是由希望分享好的内容的诚实人士制造的,具有讽刺意味的是,这会给您带来不必要的问题:重复内容。 好吧,我们会为你把这件事告诉全世界。
为什么重复内容是个问题
(警告:以下是对重复内容的高度简化,旨在为创建内容的营销人员提供非常基本的信息。如果您是一名活跃的 SEO 从业者,则存在许多重复内容问题(例如 URL 参数和会话 ID,等),本文根本没有解决。对于更高级的内容,我们建议Moz 的最佳实践指南,“什么是重复内容?”
“重复内容”是指当一个网站托管两页内容相同或几乎相同,或者两个(或更多)网站托管一页内容几乎相同时产生的问题。 这是它引起的问题类型的说明:
站点 A 发布了查尔斯狄更斯第三任妻子的 600 字传记。 站点 B 想与读者分享这本传记,并请求允许将其发布在站点 B 的博客上。 许可授予。 网站 B 在自己的网站上发布了这篇文章。 副本是一样的,但博客文章的标题略有不同,其 URL 也不同。
- 站点 A 页面的 URL 是:www.sitea.com/Dickens-third-wife-ran-coffee-shop。
- 站点 B 页面的 URL 是:www.siteb.com/Dickens-beloved-third-wife-Althea-ran-coffee-shop。
亲爱的读者,问问你的手机:“谁是查尔斯·狄更斯的第三任妻子,她发生了什么事?”
如果搜索引擎确定 600 字的传记是对您请求的最佳答案,则引擎不知道是选择网站 A 还是网站 B 上的页面返回。 它会嗅探任何差异(也许站点权威会帮助它做出决定),但本质上,它处于进退两难的境地。 对于繁忙的搜索引擎来说,这不是挂断电话的好地方,引擎会对此感到恼火。
谷歌和其他引擎不喜欢重复的内容,因为这会使他们的工作变得更加困难,并影响他们返回最佳结果的能力。 (返回良好的结果是搜索引擎如何在我们的感情中消长,因此他们如何收取广告费用 - 他们如何生活和死亡。)当他们在您的页面上发现重复内容时,他们有能力通过忽略来发泄这种不满你,从而使你的网站更难找到 - 对你的入站营销工作造成重大影响。
使搜索引擎能够直接轻松地查找和评估您的内容称为“搜索引擎优化”。 SEO 的对立面没有常用术语,但也许应该有。 (欢迎提出建议。)
您自己网站上的重复内容
解决这个问题很容易。 在您自己的网站上复制内容永远没有充分的理由。 每个页面都应该讲述自己独特的故事,任何两页都不应讲述完全相同的故事。 假设您饲养和销售约克夏犬,您的目标是让人们选择约克犬而不是其他品种。 您只需要一页重点介绍该品种的可爱性格。 这种性格可以在其他页面上提及,但每个页面都应该有自己的重点(如何训练、喂什么、寿命、历史、如何购买等)。 那些其他页面可以提及气质并链接到性格页面; 这对读者来说是件好事,因此对 SEO 也有好处。
如果您有多个站点并且有适合所有站点的内容,您可以将其发布到所有站点上; 继续阅读,并特别注意末尾的“rel=canonical”信息。
内容农场的复制
“内容农场”从网络上抓取好故事并机械地或以其他方式传播它仍然很常见。 目标是讲述相同的故事(并获得相同的内容价值),同时进行足够的更改,以便搜索引擎不会将其识别为重复内容。 这是一种剽窃形式,一种黑帽技术,如果搜索引擎发现它,它们就会猛扑过去。 (太棒了!)如果您正在雇用某种机构来帮助您创建内容,请确保他们没有转载他人的内容。 如果在您的网站上发现复制副本,您将承担罚款,无论您是多么无辜地购买它或雇用谁为您创建它。 (另外:好的内容需要时间或金钱,或两者兼而有之;没有真正的捷径。买家要当心。)
策展不应重复
有时您会发现一个非常聪明、有用或写得很好的故事,以至于您想分享它。 您始终可以在推文或 Facebook 帖子中引起对它的关注(当然,将其归因于其作者)。 如果你简单地重新发布它,这种无辜的分享可以作为一种欣赏的形式开始……但以重复的内容结束。 如果您想策划某人的内容,只要操作正确,这是一种受欢迎的共享形式。 (不成文的)规则是:
- 只分享您知道自己的读者会喜欢发现的内容。
- 不要重新发布整个故事。 选择片段或几段。
- 注明原作者或网站,并链接到原始内容。
- 包括你自己的意见。 有独特的话要说; 这是真正表明您的作品是原创作品的东西。 你自己的话应该构成文章的主体。
- 首先与作者联系并让他们知道您正在策划他们的作品,这很好,而且很有礼貌(如果并非总是严格实用或必要的话)。 拥有 50 万粉丝或在主要报纸上有专栏的人可能不会回应,但在各自领域内知名的人(如果不是公众人物)可能会回应,而且他们通常会对此表示赞赏。
把它想象成一篇书评:你通过吸引人们对这本书的关注来增加价值,你也在通过你的评论来增加价值。 你不是在重印这本书(但你确实链接到它以便人们可以轻松找到并阅读它)。
什么是 rel=canonical? – 为什么你应该关心
迟早会有一篇文章或博客文章您想从根本上重印。 也许有人刚刚说了一些非常完美的话,以至于你不想删减它并整理它——你想重新发布整个事情,就像它一样,为了你的读者的利益。 或者,也许您为另一个网站或博客写了一篇客座文章,并且您希望自己的读者看到它。 您可以通过在重新发布的文章的元数据中使用 rel=canonical 标签来做到这一点,而不必冒因重复内容而激怒 Google(等)的风险。

您可以将 rel=canonical 视为指向“规范”页面的 URL 方向。 “规范”是基本原则、公认标准、某些事物的基本基础等。“规范”页面是基本的、原始的、源页面; “rel=”表示“关系”。 所以,rel=canonical 本质上意味着“可以在这个 URL 地址找到这个页面的规范版本”。 (可以在此处找到有关规范链接的更详细的杂草信息。)
大多数网页的元数据字段中已经有 rel=canonical。 默认值通常是网页的 URL。 如果您使用内容管理系统,则 rel=canonical 很可能是标准标签,默认情况下使用页面自己的 URL。
最近,工业质量管理部门的 Ricky Bandelin 在 Act-On 的营销行动博客上发表了一篇关于交付能力的优秀客座文章。 以下是源代码中的 rel=canonical 在我们网站上的样子:

Ricky 也在他自己的网站上发布了这篇文章。 请注意,虽然他的大部分源代码不同,但 rel=canonical 与 Act-On 博客上的相同。 它告诉谷歌(或任何搜索引擎)原始内容在那里,在那个 Act-On URL 上。 它的行为类似于 Google(等)的一种重定向。

现在假设有人搜索 duck + deliverability + email。 Google 可以同时查看这两个页面并知道返回哪一个。 显示 Act-On 博客的网页将是向搜索者显示的页面,因为在该内容所在的两个位置,每个人都同意 Act-On 博客页面是规范页面。
回到我们狄更斯夫人 600 字传记的例子:
站点 A 页面的 URL 是 www.sitea.com/Dickens-third-wife-ran-coffee-shop。 rel=canonical 是:
- <link rel=”canonical” href=”https://sitea.com/Dickens-third-wife-ran-coffee-shop/” />
站点 B 页面的 URL 是 www.siteb.com/Dickens-beloved-third-wife-Althea-ran-coffee-shop。 但 rel=canonical 现在与站点 A 相同:
- <link rel=”canonical” href=”https://sitea.com/Dickens-third-wife-ran-coffee-shop/” />
搜索引擎确切地知道要返回哪个页面; 他们没有问题。 网站 B 的内容营销人员可以向他们的读者展示精彩的内容,而且没有重复内容的风险。 .
在内容管理系统中设置 rel=canonical 链接
您不必成为代码向导即可进行设置。 我们将使用博客文章作为示例。
如果您使用 WordPress 和 Yoast:
1. 在 WordPress 中准备您的博客文章草稿
2. 转到您要重新发布的帖子或文章的网页; 复制网址
3. 在您的 WordPress 应用程序中返回您的草稿
4.点击SEO面板中的“高级”
5. 在打开的面板中,向下滚动到规范 URL 字段。

6. 输入您复制的 URL。 Yoast 插件将为您添加 rel= 位
对于其他内容管理系统,通常有类似的 rel=canonical 字段或其等效字段。
如果没有明显的字段,您可以在页面的源代码中创建一个 rel=canonical 链接。
直接在源码里设置一个rel=canonical
1. 将您的博文设置为草稿
2. 转到包含您要重新发布的内容的页面
3.右键单击并选择“查看页面源代码”
4. 在页面上,查找 rel=canonical 元标记
5.复制整个标签序列
它应该看起来像这样:
<link rel=”canonical” href=” https://www.what-ever-the-text-actually-is/ “ />
6. 将您自己的 rel=canonical 标签替换为您复制的标签
现在,当你发布这篇文章时,你的元数据会让谷歌知道这个页面的规范版本在哪里。 恭喜; 你刚刚让搜索引擎非常高兴。 这是一件好事。
有关 rel=canonical 的更多信息,请参阅 Google 的帖子“ Rel=Canonical 的 5 个常见错误”。
有关基本 SEO 的更多信息,请阅读 SEO 101:基础知识及其他
注意:这张照片实际上是凯瑟琳·霍加斯·狄更斯的照片,她是查尔斯·狄更斯唯一的妻子。
