关于谷歌缓存你需要知道的一切
已发表: 2020-05-20您可能知道 Google 使用爬虫机器人浏览网站并扫描内容。 但是您知道 Google 不只是通过网站抓取吗?
这家 IT 巨头还将所有扫描的站点记录并存储在其服务器上的数据库中。 这个数据库叫做谷歌缓存,今天我们来仔细看看。
什么是谷歌缓存?
我们可以访问的所有网站都存储在远程服务器上。 为了向用户提供搜索结果,Googlebot 必须访问网站、抓取内容并将其编入索引。
然而,谷歌还做了一件事。 它会拍摄每个网页的快照并将其保存为备份,以防实时页面由于任何原因不可用。 谷歌保留了数百万个站点作为备份,这个统一的数据库被称为谷歌缓存。
这种做法改善了用户体验。 例如,如果您对任何搜索结果感兴趣,但它们当前不可用(已删除、离线或其他),您可以通过 Google 缓存访问该网页。
如果您查看 Google 搜索结果页面,您会发现搜索结果实际上在 SERPS 中附有网站的快照。 谷歌已经优化了它的平台,以便算法返回搜索结果,并附上谷歌缓存中相关页面的链接。
考虑到缓存系统与爬网和索引系统完全分离,这真是太神奇了。
例如,如果您输入什么是 google cache ,您将获得大约 458,000,000 个结果,并且每个结果都带有指向实时页面和 Google Cache 中的页面的链接。
Google 会定期更新 Google 缓存。 如果设计师对网站进行更改,除非 Google 更新网站快照,否则他们不会出现在 Google 缓存中。
为什么缓存网站很重要?
网站总是在变化。 大多数变化是网站所有者为使网站在用户体验和与目标受众的相关性方面更好的营销努力的结果。
但是,还有其他罪魁祸首,例如黑客,他们故意破坏网站上的信息,或者导致致命数据错误的意外情况。
以下是缓存网站很重要的几个原因。
已删除的网页
一些网站所有者会删除整个网页,用户可能需要这些页面上的信息。 多亏了谷歌缓存,人们仍然可以访问在实时网站上早已消失的网页。
提高整个 Internet 的页面加载速度
将缓存数据提供给网站访问者可以减少用户请求和服务器之间的时间——这一操作可以加快加载时间,例如,这对于提高搜索排名很重要。 如果您使用的是 WordPress(例如 35% 的网站),您应该查看这些插件以优化加载时间。
此外,流量激增会减慢服务器响应时间,从而显着提高页面加载速度。 发送缓存数据而不是实时网页是克服这一挑战并保持良好用户体验的最佳方式。
方便的备份
谷歌缓存可以帮助恢复整个网站,因为它将您的所有网页存储在一个安全的位置。 当然,定期自己进行网站备份仍然有意义。 如果您要管理大量视觉内容,您还应该考虑使用数字资产管理 (DAM) 工具将所有视觉资产组织在一个地方。
何时使用 Google 缓存
任何事情都有时间和地点,因此最好了解何时应该使用 Google 缓存。 以下是您需要执行此操作的一些场景。
访问受地理限制的内容
出于各种原因,网站经常实施地理限制。 谷歌缓存没有界限。 即使在他们居住的地区无法访问原始网站,人们也可以通过 Google Cache 访问他们喜爱的网络内容。 如果您碰巧遇到这种情况,您可以使用 Google Cache 轻松绕过地理限制。
检查上次抓取日期
您的内容努力的结果将反映您的网站在搜索引擎结果页面 (SERP) 中的排名。 但是,更新您的网站并上传新内容并不意味着立竿见影。 谷歌首先必须重新索引您的网站。 查看 Google 上次为您的网站编制索引的时间的唯一方法是使用 Google Cache。 Google Search Console 的索引覆盖率报告详细报告了他们上次抓取您的网页的时间,以及该网页是否已被编入索引。
此外,一旦您进行更改以产生丰富的摘要,除非 Google 重新索引您的网站,否则它们将不会反映您的网站在 SERP 中的显示方式。 您必须密切关注最后的索引日期,才能知道您的更新何时会显示在 SERP 中。
访问丢失的内容
丢失的内容是删除的内容。 Google Cache 提供了一种便捷的访问方式,这对网站所有者和用户来说都是好消息。 在任何情况下,如果您的托管服务提供商未能备份您的网站,并且由于服务器故障或黑客攻击而被删除,您可以从 Google 缓存中完整恢复。
这同样适用于发现自己喜欢的网站不再可用的用户。 多亏了 Google Cash,即使官方网站上不再存在您喜欢的内容,您也可以返回并探索它。

如何访问网站的缓存版本
现在您已经了解了 Google Cache 是什么、为什么它很重要以及何时使用它,是时候学习如何访问网站的缓存版本了。 有几种方法可以做到这一点,我们将逐步指导您完成每个选项。
直接通过 Google 访问缓存网页
您可以直接从 Google 访问所有编入索引的网页。 这是迄今为止最方便的方法。 您在 Google 的搜索框中键入搜索查询并转到搜索结果。 要直接搜索网站,您的搜索查询应为www.websitename.com 。 在搜索结果中找到您要查找的网站,单击搜索结果旁边的灰色小箭头,然后选择Cached 。
单击缓存后,Google 将为您提供由 Googlebot 索引的最新版本的网站。
您可以从三种类型的缓存网页视图中进行选择——完整版、纯文本版和查看源代码。
如果单击完整版,您将能够看到缓存页面的渲染视图。 纯文本版本不包括 CSS 并显示没有任何图像的网页,而查看源代码允许您查看 Googlebot 拾取的 HTML 代码。
使用谷歌浏览器
您可以直接从 Google Chrome 网络浏览器访问 Google Cache。 打开谷歌浏览器并输入以下地址cache:www.websitename.com 。
此操作使您可以直接访问您喜欢的网站或您自己的网站的缓存版本,而无需查看搜索结果。
使用谷歌浏览器插件
有几个 Google Chrome 插件,例如 Web Cache Viewer,可以让您随时随地访问网页的缓存版本。 首先,您必须将其添加到 Chrome。 这很简单。 您所要做的就是点击Add to Chrome 。
浏览时,您可以在网页上的任意位置单击鼠标右键,然后选择 Web Cache Viewer > Google Cache Archive 以查看被 Google 索引的页面的最新版本。
探索不同的网络档案
这可能会让您大吃一惊,但 Google 并不是唯一一个存档网页的实体。 全球范围内的各种网络存档计划目前都在做同样的事情。 它们可能不像 Google 那样与更新和抓取一致,但当您需要访问已删除或受地理封锁的网页内容时,它们仍然可以证明是有价值的资源。
有几十个网络存档计划,我们无法在此处全部列出。 以下是一些进一步的例子:
- 欧盟网络档案
- 互联网档案馆的 Wayback 机器
- 学期末网络档案
结论
谷歌缓存是一个强大的资源供您使用。 它可以帮助您访问已删除的内容、绕过地理限制、使用索引页面作为您网站的备份,或者控制您的营销、内容和SEO 工作。 如您所见,除了 Google Cache 之外,您还可以使用其他 Web 归档计划。