Les problèmes d'indexation de page typiques et quelques correctifs

Publié: 2021-11-27

Presque tous les sites Web reconnaissent l'importance d'être indexés sur Google. Mais ce n'est pas une partie de plaisir. Certaines pages ne parviennent pas à être indexées. Quiconque gère un grand site Web saura que toutes les pages n'ont pas besoin d'être indexées par Google. Et même s'ils le font, le contenu devra peut-être attendre longtemps avant que le géant des moteurs de recherche ne les sélectionne. Diverses raisons peuvent être responsables de telles expériences, telles que les liens et la qualité du contenu. Ce ne sont qu'un exemple. Les nouveaux sites Web qui utilisaient les dernières technologies Web ont également rencontré des problèmes, et certains y sont encore confrontés.

Certains experts en référencement suggèrent que les problèmes techniques peuvent être le principal obstacle à l'indexation de contenu, alors que cela n'a pas à être vrai. Bien sûr, vous pouvez perdre l'opportunité en raison de signaux techniques contradictoires ou d'un budget de crawl insuffisant. Mais ceux-ci ne sont aussi pertinents que la qualité du contenu en la matière. De nombreux petits et grands sites Web avec beaucoup de contenu s'attendent à une indexation plus rapide, mais cela ne fonctionne pas de cette manière. En même temps, peu importe que vous utilisiez JavaScript ou HTML. Dans toutes les situations, un problème d'indexation peut survenir. Par conséquent, il est essentiel d'approfondir les facteurs qui affectent cela et de les améliorer. Alors, explorons.

Quels sont les défis d'indexation les plus courants ?

Crawlé mais pas indexé actuellement

Cela montre que le bot Google a visité votre page mais n'a pas déclenché l'indexation. Une telle situation peut être attribuable à la faible qualité du contenu. En raison du saut soudain des entreprises de commerce électronique, Google est devenu pointilleux sur la qualité. Pour éviter cette situation, vous devez rendre votre contenu plus précieux avec des titres, des descriptions, etc. Assurez-vous de ne pas soulever les détails du produit provenant de sources extérieures. L'utilisation de balises canoniques pour la consolidation de contenu dupliqué peut également être intelligente. De plus, si vous savez que certaines catégories ne sont pas de bonne qualité, vous pouvez empêcher Google d'explorer ces pages à l'aide de la balise noindex.

Découvert mais non indexé actuellement

Certains experts en référencement adorent ce défi pour son ampleur, allant de l'exploration aux problèmes de qualité du contenu. C'est pourquoi vous n'aurez peut-être pas à vous soucier si vous avez une entreprise de marketing numérique compétente pour aider votre cause. De nombreux grands magasins en ligne sont confrontés à cette difficulté pour de nombreuses raisons. L'un peut être le budget d'exploration, qui concerne plusieurs URL en attente d'exploration et d'indexation. Le problème de qualité peut être un autre facteur. Google peut ignorer certaines pages du domaine pour la qualité du contenu.

Quoi qu'il en soit, si vous voyez le statut comme "découvert - actuellement non indexé", vous pouvez envisager de prendre quelques mesures. Par exemple, vous pouvez rechercher des modèles dans les pages appartenant à une catégorie ou à un produit spécifique. Si le budget de crawl est le principal défi, vous devez dénicher les pages de contenu de mauvaise qualité à partir des pages de recherche internes et des pages de catégories filtrées. Étant donné que le volume peut atteindre des milliers, voire des millions, vous devez trouver vos principaux suspects ici. En raison de ces coupables, le bot Google peut prendre plus de temps pour atteindre le contenu réel digne d'être indexé. Ainsi, il sera idéal que vous optimisiez votre budget.

Contenu identique

Votre site Web peut être confronté à ce problème en raison des différentes versions de la même page créées pour d'autres pays cibles, comme le Royaume-Uni, les États-Unis et le Canada. Ces pages peuvent ne pas être indexées. Une autre source peut être le même contenu utilisé par un site concurrent. Vous pouvez vous y attendre dans l'industrie du commerce électronique, car de nombreux sites Web proposent les mêmes produits avec les mêmes descriptions. Vous pouvez résoudre ce problème grâce à la création de contenu unique, aux redirections 301 et à rel=canonical. Vous pouvez ajouter des expériences utilisateur via votre contenu en comparant des offres similaires ou en fournissant une bonne FAQ.

Comment déterminer le statut d'indexation de votre site ?

Vous pouvez commencer avec des pages non indexées, puis y rechercher des modèles pour un identifiant familier. Sur un site Web de commerce électronique, vous rencontrerez très probablement de tels problèmes dans les pages de produits. Bien que ce ne soit pas un bon scénario, vous ne pouvez pas vous attendre à ce que toutes les pages soient indexées s'il s'agit d'un site de commerce électronique étendu. Après tout, ils contiendront des articles en rupture de stock, des produits périmés et du contenu en double. Tous ces éléments indiquent une mauvaise qualité dans la file d'attente d'indexation. De plus, le budget de crawl est également un problème avec les grands sites Web. Une boutique en ligne avec des millions de produits peut avoir 90% de pages non indexées. Vous ne devez vous en préoccuper que si celles-ci incluent des pages de produits critiques.

Comment rendre vos pages dignes d'être indexées par Google ?

Certaines bonnes pratiques peuvent augmenter les chances d'exploration et d'indexation des pages de votre site Web. L'un d'eux est de garder une distance avec les signaux "Soft 404", tels que les textes "Non disponible", "Non trouvé" dans le corps du contenu ou "404" dans l'URL. Les liens internes permettent à Google de reconnaître une page comme faisant partie intégrante de votre site Web. Assurez-vous donc de ne manquer aucun d'entre eux dans la structure du site. Veuillez également les inclure dans les plans de site.

Vous savez déjà qu'un contenu de mauvaise qualité ou dupliqué peut avoir un impact négatif sur les possibilités d'indexation. Pour les supprimer des sitemaps, appliquez la balise 'noindex' ou le fichier robots.txt chaque fois que cela est pertinent. Cela empêchera le bot Google de passer un temps inutile sur des parties non désirées du domaine, ce qui pourrait le faire douter de la qualité de votre site. En même temps, vous devez arrêter d'envoyer des signaux SEO déroutants à Google. Pensez à la situation où une balise canonique utilise JavaScript et une autre HTML.

Google a énormément évolué ces dernières années dans le domaine de JavaScript. Les experts en référencement peuvent pousser un soupir de soulagement car les problèmes d'indexation avec les sites basés sur JavaScript sont devenus moins courants. Mais tous les problèmes d'indexation ne sont pas liés à JavaScript. Par conséquent, il vaut mieux être prudent avec sa stratégie et son approche. Après tout, Google ne dispose que de ressources limitées pour l'exploration. C'est pourquoi un certain pourcentage du contenu peut ne jamais être exploré et indexé. Si vous voulez être performant, vous devez réfléchir à toutes les situations et faire ressortir vos pages tout en ajoutant de la valeur à l'expérience utilisateur. Ces efforts peuvent ne pas conduire à l'indexation de toutes les pages, mais ils peuvent augmenter les chances pour Google de les repérer et de les indexer.