Index : Google Search Console

Dernière actualisation : 04/05/2021

Le processus d’exploration et d’indexation est une étape nécessaire (mais non suffisante) pour réussir son référencement naturel et s’imposer en première page de Google. Pour vous aider dans votre référencement naturel, Google Search Console propose différentes informations utiles autour de l’exploration et de l’indexation de vos pages.

La partie Index se compose de trois rapports et fonctionnalités utiles aux professionnels du SEO :

  • Couverture
  • Sitemaps
  • Suppressions

Couverture

Le rapport Couverture vous apporte des informations précieuses sur la bonne exploration et la bonne indexation de vos pages web. Il se compose de 4 onglets :

  • Erreur
  • Valides avec des avertissements
  • Valides
  • Exclues

Erreur

Dans Index > Couverture, le rapport Erreur de Google Search Console vous remonte différents types d’erreurs que le Googlebot a pu rencontrer durant son exploration :

  • Erreur de serveur (5xx) : une erreur de type 5XX a été renvoyée au Googlebot. Par exemple, une erreur 500 signale une erreur interne au serveur, une erreur 503 indique un serveur indisponible.
  • Erreur de redirection : des redirections en boucle, ou des URL de redirection trop longues, bloquent le processus d’exploration et remontent en erreur.
  • URL envoyée bloquée par le fichier robots.txt : vous avez soumis une URL par sitemap, mais vous la bloquez dans le même temps en utilisant votre fichier robots.txt.
  • URL envoyée désignée comme noindex : vous avez soumis une URL par sitemap, mais elle contient dans le même temps une balise <meta name=”robots” content=”noindex”>.
  • L’URL envoyée semble être une erreur de type “soft 404” : vous devez adopter un autre code de réponse (404 pour not found, ou 410 pour gone, par exemple), ou apporter un contenu à forte valeur ajoutée.
  • L’URL envoyée renvoie une demande non autorisée (401) : le Googlebot n’a pas accès à la page, car il ne dispose pas des éléments d’authentification requis.
  • URL envoyée introuvable (404) : vous avez soumis une URL par sitemap, mais elle est introuvable. Vous devez actualiser votre fichier sitemap et le purger des URL en 404.
  • L’URL envoyée a renvoyé l’erreur 403 : vous avez soumis une URL par sitemap, mais elle renvoie une réponse 403 au Googlebot (accès interdit).
  • URL bloquée en raison d’un autre problème de type 4xx : il existe plus d’une trentaine de codes de réponse 4xx, et certains étant très rares, il n’était pas nécessaire de faire figurer dans Couverture, sur Google Search Console, une ligne par type de réponse.

Valides avec des avertissements

Certaines pages peuvent être valides, tout en nécessitant une attention particulière de la part du SEO que vous êtes :

  • Indexée malgré le blocage par le fichier robots.txt : le robots.txt est là pour empêcher le processus d’exploration, mais il ne vous apporte pas l’assurance d’une non-indexation de votre page. Pour cela, il n’y a qu’une seule solution : la balise <meta name=”robots” content=”noindex”>.
  • Page indexée sans contenu : une URL a bien été indexée, mais Google n’a accès à aucun contenu. Il s’agit généralement d’un problème technique, le Googlebot ne parvenant pas à lire votre code source ou les éléments de contenu.

Exclues

  • Exclue par la balise “noindex” : il est tout à fait normal de vouloir empêcher le référencement de pages web avec une balise noindex <meta name=”robots” content=”noindex”>. Je vous invite à y jeter un œil régulièrement, pour vous assurer qu’aucune page stratégique se retrouve malheureusement bloquée par la balise <meta robots>.
  • Bloquée par l’outil de suppression de pages : les contenus que vous avez temporairement bloqués grâce à la fonctionnalité Suppressions apparaissent ici.
  • Bloquée en raison d’une demande non autorisée (401) : vous avez soumis une URL par sitemap, mais elle renvoie un code de réponse 401. Vous devez soit la sortir du sitemap, soit corriger le code de réponse et renvoyer un code 200.
  • Explorée, actuellement non indexée : le Googlebot est bien passé sur l’URL, mais le moteur ne l’a pas (encore) indexé. Vous pouvez pousser le processus d’indexation en mettant en avant votre page dans votre maillage interne, ou utiliser l’outil d’inspection de l’URL pour redemander une exploration (à utiliser avec parcimonie).
  • Détectée, actuellement non indexée : la page a été détectée, mais n’a pas encore été explorée. Vous pouvez utiliser les mêmes conseils que ceux donnés pour les pages explorées et non indexées.
  • Autre page avec balise canonique correcte : la page exclue est perçue comme le doublon d’une autre URL qui est considérée comme canonique par Google.
  • Page en double sans URL canonique sélectionnée par l’utilisateur : une page possède plusieurs doublons, mais aucun d’entre eux n’a de balise canonique. L’algorithme n’arrive pas à déterminer quelle page doit être considérée comme canonique.
  • Page en double, Google n’a pas choisi la même URL canonique que l’utilisateur : ce cas peut notamment exister si l’URL maillée dans votre menu et vos liens internes n’est pas l’URL canonique. Par exemple, vous maillez partout l’URL https://www.monsite.com/exemple et vous mettez comme URL canonique https://www.monsite.com/exemple/. Google tient compte de l’URL avec slash.
  • Introuvable (404) : une page introuvable finit par être exclue de l’Index Google.
  • Page avec redirection : idem, seule l’URL de destination est indexée. Pensez à corriger les liens internes, car une redirection ralentit (très légèrement, mais aussi inutilement) le processus de crawl (d’exploration).
  • Soft 404 : une page en Soft 404 renvoie un code de réponse 200 (tout va bien), mais en réalité elle prévient l’utilisateur que l’information recherchée est introuvable. Une page d’annuaire qui renvoie “aucun professionnel trouvé sur cette ville” peut par exemple être perçue comme étant une soft 404.
  • Page en double, l’URL envoyée n’a pas été sélectionnée comme URL canonique : vous avez envoyé cette URL par sitemap, mais elle fait partie d’un jeu de doublons sans canonique et Google privilégie une autre page.
  • Bloquée en raison d’une interdiction d’accès (403) : cette interdiction d’accès relève d’une erreur. Si vous justifiez le renvoi d’une 403, vous bloquerez l’exploration ou l’indexation de la page (robots.txt ou balise <meta robots>).
  • Bloquée en raison d’un autre problème de type 4xx : il existe d’autres codes de réponse 4xx qui justifient l’exclusion d’une URL, comme 410 (Gone, ou définitivement supprimée).

Valides

Vous pouvez aussi suivre le volume de pages correctement indexées par Google. Deux cas de figure se présentent :

  • Envoyée et indexée : tout va bien !
  • Indexée, mais non envoyée via un sitemap : votre URL est accessible, le plus souvent par le maillage interne ou du netlinking, mais elle n’a pas été ajoutée dans votre sitemap.

Sitemaps

En bref, vous obtenez quelques informations utiles sur vos fichiers sitemaps :

  • dernière lecture
  • nombre total d’URL découvertes

Cet outil vous offre aussi – et surtout – deux fonctionnalités très utiles : ajouter un sitemap et vérifier les sitemaps envoyés.

Ajouter un sitemap

Vous devez simplement préciser l’URL de votre sitemap pour le soumettre à Google.

Si vous avez un sitemap qui recense lui-même plusieurs sitemaps, il suffit de soumettre ce fichier index.

Vous ne vous adressez qu’à Google ! Pensez aussi à ajouter une ligne dans votre fichier robots.txt pour toucher l’ensemble des moteurs de recherche (et cela ne fera pas de mal non plus à votre SEO Google) :

Sitemap: http://www.mon-domaine.fr/sitemap.xml

Sitemaps envoyés

En cliquant sur l’un des sitemaps envoyés, vous pouvez savoir grâce à Google Search Console, s’il a bien été traité, et connaître le nombre d’URL prises en compte. Vous pourrez ainsi améliorer votre référencement naturel.

Vous souhaitez approfondir vos connaissances ? Vous pouvez consulter le dossier consacré au Sitemap.

Suppressions

Vous avez la possibilité grâce à Google Search Console de supprimer certaines URL de l’index, ou de surveiller la suppression de certains types de contenus.

Suppressions temporaires

Vous pouvez être amené à vouloir supprimer rapidement une page de l’index Google, par exemple pour des raisons de vie privée. Grâce à cet outil, c’est possible !

Il s’agit d’une suppression temporaire, annoncée à six mois environ. Pour une suppression définitive, pensez aussi à supprimer le contenu ou à le bloquer (balise <meta robots>).

Google détaille les conditions d’utilisation de cet outil sur son aide en ligne.

Contenu obsolète

Cet outil répond à un besoin bien précis, et concerne des pages dont vous n’êtes pas le propriétaire. Vous pouvez demander la mise à jour des résultats de recherche :

  • pour des pages ou des images qui n’existent plus ;
  • pour des pages dont une partie du contenu (jugé sensible ou critique) a fait l’objet d’une modification ou d’une suppression.

Si vous êtes le propriétaire, vous pouvez utiliser les autres fonctionnalités de Google Search Console pour supprimer le contenu ou demander une réexploration avec l’outil Inspection de l’URL.

Filtrage SafeSearch

Le filtrage SafeSearch permet d’empêcher l’affichage de contenus adultes explicites. Mais il peut arriver que vous tombiez sur des contenus choquants. Vous pouvez les signaler par https://www.google.com/webmasters/tools/safesearch.

Si d’autres utilisateurs ont signalé des contenus liés à votre propriété, vous les verriez remonter ici (ce qui n’est pas le cas dans mon exemple).

Autres fonctionnalités et outils

Pour améliorer votre SEO, vous pouvez mettre à profit d’autres fonctionnalités :