Définition

Une URL canonique est la version préférée d’une page web lorsque plusieurs pages ont un contenu proche. La balise indique aux moteurs de recherche la page sur laquelle il faut que les robots se concentrent. C’est la page référente des contenus dupliqués. La balise « canonical » se trouve dans la partie Head du code HTML de votre page sous cette forme : <link rel= »canonical » href= »URL canonique »>.

Google utilise l’information de la balise canonique comme source principale pour évaluer le contenu et la qualité.

A quoi sert la balise canonical ?

Cette balise indique aux Googlebots quelle url est la page référente de votre contenu dupliqué. C’est-à-dire celle qu’il doit explorer et indexer.  Google n’est pas obligé de suivre cette indication. Il peut privilégier une autre page s’il la juge plus proche sémantiquement.

Si le même contenu se trouve sur différentes urls, l’utilisation de la balise canonical aidera Googlebot à mieux comprendre quel contenu est important pour vous. Ce recours va résoudre les problèmes de duplicate content internes. Utiliser la balise canonique permet donc d’améliorer le classement de vos contenus dans les moteurs de recherche.

La balise canonique fait donc partie des différentes façons d’indiquer aux robots de Google qu’un autre contenu sur votre site a une version très similaire.

Voici les trois solutions en cas de duplicate content sur votre site :

  • Une redirection 301 de la page dupliquée vers la page référente,
  • Insérer une balise noindex dans la page dupliquée,
  • Personnalisation des pages dupliquées pour avoir des contenus uniques.

Google, l’unicité et la qualité des contenus

Au fil des années, l’algorithme de Google est devenu de plus en plus sévère avec la qualité des contenus proposés par les sites. C’est depuis la mise à jour « Panda » en 2011 que Google a officiellement introduit « la qualité de contenu » comme critère de positionnement. Depuis cette mise à jour majeure, Google pénalise les sites proposant des contenus de faible qualité, trompeurs ou dupliqués. Cette duplication peut venir de contenus internes au site ou d’autres sites web.

Les consignes de Google à ce sujet :

  • Ne pas créer plusieurs pages, domaines ou sous-domaines avec un contenu substantiellement dupliqué.
  • Eviter les approches de cookie cutter comme les programmes d’affiliation avec très peu de contenu original.
  • Si votre site participe à un programme d’affiliation s’assurer que vous proposez un contenu qui a de la valeur.
  • Les pratiques de scraping de contenus des autres sites sont fortement déconseillées.

Exemple d’utilisation d’un tag canonique

Vous l’aurez compris, l’url canonique permet d’indiquer à Google sur quelle url il doit se focaliser lors de son passage s’il rencontre d’autres urls similaires ou ayant le même contenu.

Exemple :
Url 1 : /chaussures-femme.html
Url 2 : /chaussures-femme-1.html (contenu identique à l’URL 1)
Url 3 : /chaussures-femme-test.html (contenu identique à l’URL 1 et 2)

L’url canonique à indiquer dans le code source des urls 2 et 3 est : « /chaussures-femme.html ». Ainsi Google comprendra que les doublons de l’url 1 sont bien l’url 2 et 3.

Comment vérifier vos url canoniques ?

  1. A l’aide d’un outil de crawl (screaming frog, botify, oncrawl….) vous parviendrez à explorer toutes les pages de votre site et à identifier les balises canoniques de vos urls. C’est la façon la plus rapide pour analyser vos urls en masse.
  2. Si vous souhaitez vérifier la balise canonique d’une url précisément ce n’est pas la peine de lancer un crawl entier de votre site. Vous pouvez simplement soumettre l’url concerné dans l’inspecteur d’url de votre compte Google search console afin qu’il vous donne l’information de la balise canonique de la page.
  3. Autre méthode pour vérifier une balise canonique est simplement d’inspecter votre code source et de rechercher « canonical » pour voir si la page possède la balise.

A savoir que Google peut définir une autre url canonique que celle que vous avez indiqué dans votre code source s’il estime qu’une page est plus pertinente avec un contenu plus qualitatif.

Conseils lors du contrôle des urls canonical de votre site

Bien veiller à ce que l’url canonique :

  • Réponde bien dans un code http 200,
  • Que l’url canonique indiquée soit la meilleure version possible par rapport au contenu dupliqué,
  • Si l’url canonique est une redirection, bien s’assurer que dans le code de la page, l’url finale de la redirection soit implémentée,
  • Vérifier que l’url canonique indiquée ne possède pas de balise « noindex » dans son code HTML,
  • Ne spécifier qu’une seule url canonique par page, si vous en indiquez plusieurs, elles seront dans ce cas toutes ignorées.

L’url canonique est explorée plus régulièrement par les bots, les pages dupliquées sont crawlées moins souvent pour réduire la charge d’exploration de Google sur votre site.

Les erreurs les plus fréquentes

  1. Faire de la page 1 d’une pagination l’url canonique pour toutes les urls de pagination à partir de la page 2. Le contenu est censé être différent sur les pages de pagination, Google ne recommande pas d’utiliser le tag canonical dans ce cas-là.
  2. Renseigner une url canonique incomplète (sans le protocole, sans le « .html »…), dans ce cas précis, Google va ignorer la balise canonical renseignée puisqu’il ne la reconnaîtra pas. Peut-être qu’il en attribuera lui-même une autre s’il trouve un contenu plus qualitatif. Vous trouverez cette information dans votre compte Google Search Console.
  3. Plusieurs urls canoniques sont renseignées dans le code source d’une page, cela peut se produire lorsque vous installez différents plug-ins sur votre site, des tags canoniques peuvent être ajoutés automatiquement, veillez à crawler votre site régulièrement pour vérifier ces éléments.
  4. Utiliser une balise canonique lorsque que la page catégorie ne possède qu’un seul produit. L’objectif est que votre page de catégorie et votre fiche produit soient toutes les deux visibles sur les moteurs de recherche. Nous vous recommandons donc de ne pas utiliser de balise canonique sur le produit. Il faut personnaliser au maximum le contenu de votre page de catégorie et de la fiche produit.
  5. La balise canonique se trouve en dehors de la partie Head de votre code HTML. Dans ce cas elle est ignorée par les Googlebots.
  6. Les urls canoniques indiquées en chaîne (la page A indique la page B, la page B indique une page C, etc.).
  7. Les urls canoniques en boucle (l’url A indique une version canonique B, mais la page B redirige vers l’url A).