Indexation : Google Search Console

Publié le :

| Modifié le :

| Auteur : Benjamin Thiers

Le processus d’exploration et d’indexation est une étape nécessaire (mais non suffisante) pour réussir son référencement naturel et s’imposer en première page de Google. Pour vous aider dans votre référencement naturel, Google Search Console propose différentes informations utiles autour de l’exploration et de l’indexation de vos pages.

La partie Indexation se compose de trois rapports et fonctionnalités utiles aux professionnels du SEO :

  • Pages (anciennement Couverture)
  • Sitemaps
  • Suppressions

Pages (anciennement couverture)

Le rapport Couverture vous apporte des informations précieuses sur la bonne exploration et la bonne indexation de vos pages web :

  • Non indexées
  • Dans l’index

Pour rappel, cette partie se composait autrefois de 4 onglets :

  • Erreur
  • Valides avec des avertissements
  • Valides
  • Exclues
Version actuelle (11 octobre 2022)

Non indexées

Dans Indexation > Couverture, le rapport Non Indexées de Google Search Console vous remonte différents types d’erreurs que le Googlebot a pu rencontrer durant son exploration :

  • Erreur de serveur (5xx) : une erreur de type 5XX a été renvoyée au Googlebot. Par exemple, une erreur 500 signale une erreur interne au serveur, une erreur 503 indique un serveur indisponible.
  • Erreur liée à des redirections : des redirections en boucle, ou des URL de redirection trop longues, bloquent le processus d’exploration et remontent en erreur.
  • URL bloquée par le fichier robots.txt : vous avez soumis une URL par sitemap, mais vous la bloquez dans le même temps en utilisant votre fichier robots.txt.
  • URL envoyée désignée comme noindex : vous avez soumis une URL par sitemap, mais elle contient dans le même temps une balise <meta name=”robots” content=”noindex”>.
  • L’URL envoyée semble être une erreur de type “soft 404” : vous devez adopter un autre code de réponse (404 pour not found, ou 410 pour gone, par exemple), ou apporter un contenu à forte valeur ajoutée.
  • L’URL envoyée renvoie une demande non autorisée (401) : le Googlebot n’a pas accès à la page, car il ne dispose pas des éléments d’authentification requis.
  • URL envoyée introuvable (404) : vous avez soumis une URL par sitemap, mais elle est introuvable. Vous devez actualiser votre fichier sitemap et le purger des URL en 404.
  • L’URL envoyée a renvoyé l’erreur 403 : vous avez soumis une URL par sitemap, mais elle renvoie une réponse 403 au Googlebot (accès interdit).
  • URL bloquée en raison d’un autre problème de type 4xx : il existe plus d’une trentaine de codes de réponse 4xx, et certains étant très rares, il n’était pas nécessaire de faire figurer dans Couverture, sur Google Search Console, une ligne par type de réponse.
  • URL bloquée par l’outil de suppression de pages : un utilisateur de Google Search Console ou vous-même avez demandé la suppression temporaire (90 jours) de l’URL.
  • Explorée, actuellement non indexée : le Googlebot est bien passé sur l’URL, mais le moteur ne l’a pas (encore) indexé. Vous pouvez pousser le processus d’indexation en mettant en avant votre page dans votre maillage interne, ou utiliser l’outil d’inspection de l’URL pour redemander une exploration (à utiliser avec parcimonie).
  • Détectée, actuellement non indexée : la page a été détectée, mais n’a pas encore été explorée. Vous pouvez utiliser les mêmes conseils que ceux donnés pour les pages explorées et non indexées.
  • Autre page avec balise canonique correcte : la page exclue est perçue comme le doublon d’une autre URL qui est considérée comme canonique par Google.
  • Page en double sans URL canonique sélectionnée par l’utilisateur : une page possède plusieurs doublons, mais aucun d’entre eux n’a de balise canonique. L’algorithme n’arrive pas à déterminer quelle page doit être considérée comme canonique.
  • Page en double, Google n’a pas choisi la même URL canonique que l’utilisateur : ce cas peut notamment exister si l’URL maillée dans votre menu et vos liens internes n’est pas l’URL canonique. Par exemple, vous maillez partout l’URL https://www.monsite.com/exemple et vous mettez comme URL canonique https://www.monsite.com/exemple/. Google tient compte de l’URL avec slash.

Un avertissement remonte aussi dans le rapport, sous l’intitulé “Améliorer l’apparence des pages”

  • Indexée malgré le blocage par le fichier robots.txt : le robots.txt est là pour empêcher le processus d’exploration, mais il ne vous apporte pas l’assurance d’une non-indexation de votre page. Pour cela, il n’y a qu’une seule solution : la balise <meta name=”robots” content=”noindex”>.
  • Page indexée sans contenu : l’URL est bien présente dans l’index de Google, mais son contenu est illisible. La raison peut être technique (rendu côté client non interprété par l’algorithme, par exemple).

Dans l’index

Vous pouvez facilement embrasser d’un regard l’ensemble des pages indexées, avec le nombre d’URL présentes dans l’index de Google. Vous pouvez aussi afficher des informations sur celles-ci, dont notamment la dernière exploration par le Googlebot.

Les informations se limitent aux mille dernières pages explorées et indexées par Google.

Sitemaps

En bref, vous obtenez quelques informations utiles sur vos fichiers sitemaps :

  • dernière lecture
  • nombre total d’URL découvertes

Cet outil vous offre aussi – et surtout – deux fonctionnalités très utiles : ajouter un sitemap et vérifier les sitemaps envoyés.

Ajouter un sitemap

Vous devez simplement préciser l’URL de votre sitemap pour le soumettre à Google.

Si vous avez un sitemap qui recense lui-même plusieurs sitemaps, il suffit de soumettre ce fichier index.

Vous ne vous adressez qu’à Google ! Pensez aussi à ajouter une ligne dans votre fichier robots.txt pour toucher l’ensemble des moteurs de recherche (et cela ne fera pas de mal non plus à votre SEO Google) :

Sitemap: http://www.mon-domaine.fr/sitemap.xml

Sitemaps envoyés

En cliquant sur l’un des sitemaps envoyés, vous pouvez savoir grâce à Google Search Console, s’il a bien été traité, et connaître le nombre d’URL prises en compte. Vous pourrez ainsi améliorer votre référencement naturel.

Vous souhaitez approfondir vos connaissances ? Vous pouvez consulter le dossier consacré au Sitemap.

Suppressions

Vous avez la possibilité grâce à Google Search Console de supprimer certaines URL de l’index, ou de surveiller la suppression de certains types de contenus.

Suppressions temporaires

Vous pouvez être amené à vouloir supprimer rapidement une page de l’index Google, par exemple pour des raisons de vie privée. Grâce à cet outil, c’est possible !

Il s’agit d’une suppression temporaire, annoncée à six mois environ. Pour une suppression définitive, pensez aussi à supprimer le contenu ou à le bloquer (balise <meta robots>).

Google détaille les conditions d’utilisation de cet outil sur son aide en ligne.

Contenu obsolète

Cet outil répond à un besoin bien précis, et concerne des pages dont vous n’êtes pas le propriétaire. Vous pouvez demander la mise à jour des résultats de recherche :

  • pour des pages ou des images qui n’existent plus ;
  • pour des pages dont une partie du contenu (jugé sensible ou critique) a fait l’objet d’une modification ou d’une suppression.

Si vous êtes le propriétaire, vous pouvez utiliser les autres fonctionnalités de Google Search Console pour supprimer le contenu ou demander une réexploration avec l’outil Inspection de l’URL.

Filtrage SafeSearch

Le filtrage SafeSearch permet d’empêcher l’affichage de contenus adultes explicites. Mais il peut arriver que vous tombiez sur des contenus choquants. Vous pouvez les signaler par https://www.google.com/webmasters/tools/safesearch.

Si d’autres utilisateurs ont signalé des contenus liés à votre propriété, vous les verriez remonter ici (ce qui n’est pas le cas dans mon exemple).

Besoin d’aide pour maîtriser Google Search Console ?

Vous cherchez un consultant SEO expérimenté pour vous accompagner dans vos projets ? Laissez-moi un message et nous échangerons sur vos besoins !

Autres fonctionnalités et outils

Pour améliorer votre SEO, vous pouvez mettre à profit d’autres fonctionnalités :