C’est quoi un sitemap ?

Un sitemap, ou plan du site en français, est un fichier HTML au format XML listant et regroupant toutes les URL des pages d’un site internet. Il existe également des sitemaps pour images, qui ont pour objectif de lister les URL des images.

Le sitemap a pour seul et unique but de permettre aux différents bots (Googlebot, Bingbot, etc.) d’explorer les pages d’un site en toute simplicité.

Un peu comme le plan d’une ville que l’on consulterait pour connaître toutes les rues et pour ne pas se perdre, le sitemap est le plan du site à destination des bots qui souhaitent le parcourir.
Dans les deux cas (en ville ou sur un site), on arrive toujours à se balader sans plan, mais c’est quand même plus simple quand on en a un !

Si jamais vous vous demandez à quoi peut bien ressembler un fichier sitemap, et bien en voici un à titre d’exemple :

Basique n’est-ce pas ?

Voici un exemple de sitemap généré avec Yoast, le plugin SEO pour WordPress :

Pourquoi le sitemap est important en SEO ?

Comme expliqué précédemment, il est toujours plus facile de se promener avec un plan ! Lorsqu’un bot, par exemple le Googlebot, parcourt votre site, ce dernier va suivre chaque lien qu’il va trouver sur une page. Sur la nouvelle page, il va suivre à nouveau tous les liens et ainsi de suite. Parfois, lorsque les sites ont une grosse volumétrie et dépassent les dizaines de milliers de pages, il peut arriver que certaines pages soient très loin dans la profondeur du site et que le Googlebot n’arrive pas y accéder facilement et rapidement.

Il peut également arriver que certaines pages du site ne reçoivent pas de liens internes depuis la structure. On parlera alors de pages orphelines. Et ici le seul moyen pour que Google puisse les crawler sera le sitemap.

Grâce à un sitemap, on s’assure que Google ait bien accès à la liste complète des pages du site et qu’il ait la possibilité de découvrir toutes les URLs, surtout les nouvelles pages. Même si dans la documentation de Google il est clairement indiqué que Même si vous utilisez un sitemap, nous ne pouvons pas vous garantir d’explorer ou d’indexer tous les éléments qui y sont répertoriés, car nos processus d’exploration reposent sur des algorithmes complexes il est toutefois conseillé d’en avoir un car l’utilisation de sitemaps se révèle généralement utile et ne peut en aucun cas vous pénaliser

Comment créer un fichier sitemap ?

Il existe plusieurs outils payants qui permettent de créer un sitemap facile. En voici quelques uns :

  • https://www.xml-sitemaps.com/
  • http://www.sitemapwriter.com/
  • https://www.inspyder.com/

Ces sites, outils ou générateurs de sitemaps vous permettent de générer un sitemap en toute simplicité.

Vous pouvez également vous référer à la liste de générateurs de sitemaps issue de la documentation de Google qui se trouve ici : https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki

Il est aussi possible de trouver des scripts en PHP pour générer son sitemap.

Sachez également que les crawler de type ScreamingFrog, OnCrawl ou Botify peuvent aussi vous aider à générer un sitemap rapidement.
Mais retenez bien qu’ils ne pourront pas crawler (parcourir) des pages qui sont hors de la structure du site. Car tout comme le Googlebot, les crawlers sont aussi des bots, et ils ne font que suivre des liens qu’ils peuvent voir.

Si votre site est fait avec WordPress vous aurez la chance de pouvoir utiliser le plugin Yoast qui pourra vous créer un sitemap gratuitement. Vous n’aurez plus qu’à soumettre votre sitemap 100% gratuit à Google via la Search Console ou à Bing via le Webmaster Tools.

Pour information, les sitemaps générés par Yoast seront sous cette forme là :
Une page d’index : https://foxglove-partner.com/sitemap_index.xml.
Des sous-pages en fonction de vos catégories ou typologies de pages : https://foxglove-partner.com/page-sitemap.xml.

Format de sitemap

Il est à noter que tous les fichiers sitemaps ont la même limite de taille : 50 Mo maximum (sitemaps non compressés) et 50 000 URL maximum.

Si votre fichier dépasse un de ces deux indicateurs, il faudra alors le découper en deux ou plusieurs fichiers.

Les balises obligatoires d’un sitemap sont les suivantes :

  • urlset
  • url
  • loc

Les balises optionnelles ou facultatives (non prises en compte par compte par Google) sont celles-ci :

  • lastmod
  • changefreq
  • priority

Dans le sitemap il faudra répertorier les URLs suivantes :

  • Au moins les URLs des pages les plus importantes pour vous (les pages les plus stratégiques)
  • Uniquement les URLs canoniques
  • Ne pas insérer des URLs avec des paramètres
  • Ne pas mettre les URLs des pages en erreur (ex : 404, 500…)
  • Ne pas mettre des URLs de pages qui ont une mention noindex

Comment montrer mon sitemap à Google ?

Vous avez créé votre sitemap mais vous ne savez pas quoi en faire ? C’est très simple et on va vous expliquer ça étape par étape :

  1. Placez votre fichier sitemap à la racine de votre site
  2. Rendez-vous dans la Search Console
  3. Cliquez sur “Sitemaps” dans le menu sur la gauche
  4. Saisissez l’URL de votre sitemap dans le champ vide en dessous de “Ajouter un sitemap”
  5. Une fois le path de l’URL renseignée cliquez sur le bouton “Envoyer”

Comment savoir si un site a un sitemap ?

Petite astuce ! Il est possible de consulter le fichier robots.txt de n’importe quel site !
Certains webmasters ou référenceurs y renseignent un lien vers leur sitemap, afin que les bots puissent y accéder.
Pour accéder au robots.txt de n’importe quel site, ajoutez cette information à la suite du domaine : /robots.txt.
Par exemple pour le site https://foxglove-partner.com/, ça sera : https://foxglove-partner.com/robots.txt.
Vous verrez que ça fonctionnera avec n’importe quel site web.

Et voici un exemple de fichier robots.txt affichant l’URL de son sitemap :

Vous n’aurez plus qu’à indiquer l’adresse du sitemap dans la barre de votre navigateur pour y accéder et le consulter.