Типичные проблемы индексации страниц и несколько исправлений

Опубликовано: 2021-11-27

Почти каждый веб-сайт признает важность индексации в Google. Но это не легкая прогулка. Некоторые страницы не индексируются. Любой, кто работает с большим веб-сайтом, знает, что не все страницы должны быть проиндексированы Google. И даже если они это сделают, контенту, возможно, придется долго ждать, пока гигант поисковых систем не выберет их. За такой опыт могут быть ответственны различные причины, такие как ссылки и качество контента. Это только пример. Новые веб-сайты, использующие новейшие веб-технологии, также столкнулись с проблемами, и некоторые из них все еще имеют дело с ними.

Некоторые эксперты по SEO предполагают, что технические проблемы могут быть основным препятствием при индексации контента, хотя это не обязательно так. Конечно, вы можете упустить возможность из-за противоречивых технических сигналов или недостаточного краулингового бюджета. Но в этом вопросе они имеют значение только в той мере, в какой это касается качества контента. Многие маленькие и большие веб-сайты с большим количеством контента ожидают более быстрой индексации, но это не работает. При этом неважно, используете ли вы JavaScript или HTML. В любой ситуации может возникнуть проблема с индексацией. Следовательно, важно глубоко погрузиться в факторы, влияющие на это, и улучшить их. Итак, давайте исследовать.

Каковы наиболее распространенные проблемы с индексацией?

Просканировано, но не проиндексировано в настоящее время

Это показывает, что бот Google посетил вашу страницу, но не инициировал ее индексацию. Такая ситуация может быть связана с низким качеством контента. Из-за внезапного скачка в сфере электронной коммерции Google стал придирчиво относиться к качеству. Чтобы избежать этой ситуации, вы должны сделать свой контент более ценным с помощью заголовков, описаний и т. д. Убедитесь, что вы не берете информацию о продукте из внешних источников. Использование канонических тегов для консолидации дублированного контента также может быть разумным. Кроме того, если вы знаете, что некоторые категории не очень хорошего качества, вы можете запретить Google сканировать эти страницы с помощью тега noindex.

Обнаружено, но не проиндексировано в настоящее время

Некоторые SEO-специалисты любят эту задачу за ее обширность, начиная от сканирования и заканчивая проблемами качества контента. Вот почему вам, возможно, не придется беспокоиться, если у вас есть компетентная компания цифрового маркетинга, которая поможет вашему делу. Многие крупные интернет-магазины сталкиваются с этой трудностью по многим причинам. Одним из них может быть краулинговый бюджет, связанный с несколькими URL-адресами, ожидающими сканирования и индексации. Проблема качества может быть еще одним фактором. Google может игнорировать некоторые страницы домена из-за качества контента.

Несмотря ни на что, если вы видите статус «обнаружен — в настоящее время не проиндексирован», вы можете предпринять несколько шагов. Например, вы можете искать шаблоны на тех страницах, которые относятся к определенной категории или продукту. Если основной проблемой является краулинговый бюджет, вам необходимо найти страницы с некачественным контентом на страницах внутреннего поиска и страницах отфильтрованных категорий. Поскольку объем может исчисляться тысячами и миллионами, вы должны найти здесь своих главных подозреваемых. Из-за этих виновников боту Google может потребоваться больше времени, чтобы добраться до фактического контента, достойного индексации. Таким образом, будет идеально, если вы оптимизируете свой бюджет.

Идентичный контент

Ваш веб-сайт может столкнуться с этой проблемой из-за разных версий одной и той же страницы, созданных для других целевых стран, таких как Великобритания, США и Канада. Эти страницы могут не индексироваться. Другим источником может быть тот же контент, который используется на сайте конкурента. Вы можете ожидать этого в индустрии электронной коммерции, потому что многие веб-сайты предлагают одни и те же продукты с одинаковыми описаниями. Вы можете решить эту проблему с помощью создания уникального контента, переадресации 301 и rel=canonical. Вы можете улучшить пользовательский опыт через свой контент, сравнив похожие предложения или предоставив хороший FAQ.

Как определить статус индексации вашего сайта?

Вы можете начать с неиндексированных страниц, а затем искать в них закономерности для знакомого идентификатора. На веб-сайте электронной коммерции вы, скорее всего, столкнетесь с такими проблемами на страницах продуктов. Хотя это не очень хороший сценарий, вы не можете ожидать, что все страницы будут проиндексированы, если это обширный сайт электронной коммерции. Ведь в них будут товары, которых нет в наличии, товары с истекшим сроком годности и дублированный контент. Все это свидетельствует о низком качестве в очереди на индексацию. Кроме того, краулинговый бюджет также является проблемой для больших веб-сайтов. Интернет-магазин с миллионами товаров может иметь 90% неиндексированных страниц. Вам нужно беспокоиться об этом, только если они включают важные страницы продукта.

Как сделать ваши страницы достойными индексации для Google?

Некоторые рекомендации могут повысить вероятность сканирования и индексации страниц вашего веб-сайта. Один из них — держаться подальше от «мягких» сигналов 404, таких как «Недоступно», «Не найдено» в тексте контента или «404» в URL-адресе. Внутренние ссылки помогают Google распознавать страницу как неотъемлемую часть вашего веб-сайта. Поэтому убедитесь, что вы не пропустите ни одного из них в структуре сайта. Пожалуйста, включите их в карту сайта.

Вы уже знаете, что некачественный или дублированный контент может негативно сказаться на возможностях индексации. Чтобы удалить их из карт сайта, примените тег «noindex» или файл robots.txt, когда это уместно. Это не позволит роботу Google тратить ненужное время на нежелательные части домена, что может привести к тому, что он усомнится в качестве вашего сайта. В то же время вы должны перестать посылать в Google запутанные SEO-сигналы. Подумайте о ситуации, когда один канонический тег использует JavaScript, а другой — HTML.

За последние несколько лет Google сильно развился в области JavaScript. SEO-специалисты могут вздохнуть с облегчением, потому что проблемы с индексацией сайтов на основе JavaScript стали менее распространенными. Но не все проблемы с индексацией связаны с JavaScript. Следовательно, лучше быть осторожным со своей стратегией и подходом. В конце концов, у Google есть только ограниченные ресурсы для сканирования. Вот почему некоторый процент контента может никогда не быть просканирован и проиндексирован. Если вы хотите работать хорошо, вы должны продумать все ситуации и сделать свои страницы выделяющимися, повышая ценность взаимодействия с пользователем. Эти усилия могут не привести к индексации всех страниц, но они могут увеличить шансы Google обнаружить и проиндексировать их.