Skip to main content

Google leak : les secrets de l’algorithme révélés ?

La fuite de données de la documentation d’ingénierie interne de la recherche Google révélée sur les sites de Rand Fishking et Mike King , nous permet d’en savoir plus sur le fonctionnement de l’algorithme de Google.

La documentation de l’API du Content Warehouse de Google, contient des informations sur 2 596 modules et 14 014 attributs. Les premières analyses de cette documentation, montrent que les règles de fonctionnement de l’algorithme de Google contredisent les déclarations officielles de la firme de Mountain View.

Voici quelques exemples :
Le Domain Authority, est bien pris en compte par les systèmes de classement de Google, avec la fonctionnalité “ SiteAuthority” retrouvée dans la documentation
Les clics, qualité des clics et CTR ont bien une importance dans le classement, avec le système Navboost, qui serait l’un des signaux les plus importants. Signal qui favorise les marques déjà connues.
Existence du SandBox, révélé par l’attribut appelé” hostAge” qui est utilisé spécifiquement “pour mettre en sandbox les nouveaux spams pendant la durée de diffusion”.
Données comportementales issues de Chrome sont bien utilisées pour améliorer les résultats de recherche de Google.
Les liens ont bien une importance dans le système de classement de Google. Le PageRank de la page d’accueil d’un site Web a un poids très fort car il est pris en compte pour chaque document.

. Cette documentation nous informe sur des signaux positifs parmi lesquels :

Contenu validé par un auteur (EEAT). Si cet auteur correspond à une entité, c’est-à dire une personne présente dans le Knowledge Graph de Google, cela aura encore plus de poids.
L’originalité du contenu par rapport aux autres sites, prime sur la longueur.
La présence de date (dans le contenu) et cohérence des dates
La fraîcheur du contenu. D’où l’importance de mettre à jour régulièrement ces contenus.
Le contenu le plus important est à positionner en haut de page. Google limite le nombre de tokens pris en compte pour un document.
Qualité des liens reçus, depuis des sites qui font du trafic et en lien avec sa thématique
Taille de police : Google prend en compte la taille de la police des mots et des liens dans les pages.

et des signaux de déclassement :

Les liens/ ancre de liens qui ne sont pas en cohérence avec le site cible
Pics de spam. D’où l’importance d’obtenir des liens de qualité de façon continue et progressive.
Clics courts, qui révèlent pour Google une insatisfaction de l’utilisateur vis à vis de la page d’atterrissage. D’où l’importance de bien travailler l’UX de sa page et la qualité de son contenu.
Exated Matched, domaines correspondant à la requête ciblée.
Dégradations de localisation : Google d’adapter les résultats de recherche en fonction des comportements et des préférences des utilisateurs dans différentes régions géographiques, améliorant ainsi la pertinence locale des résultats.

Quelques enseignements à retenir de ces documents pour améliorer son référencement :

Travailler l’UX de ses pages, pour ne pas décevoir l’internaute. SEO et UX doivent travailler plus étroitement ensemble, car le comportement des utilisateurs a un impact sur le classement des sites.
Travailler la qualité de ses contenus : fraîcheur, originalité et expertise
Travailler la qualité des liens
Travailler sa marque, comme le dit Rand Fishkin
« S’il y avait un conseil universel que je donnerais aux spécialistes du marketing cherchant à améliorer considérablement leur classement et leur trafic dans les recherches organiques, ce serait : « Créez une marque notable, populaire et bien reconnue dans votre environnement, en dehors de la recherche Google. »

Google a confirmé que les documents divulgués sont authentiques, mais appelle à la prudence dans l’interprétation des données. En effet, les documents ne précisent pas comment les éléments de classement sont pondérés ; ils indiquent simplement qu’ils existent.

Les tests et la poursuite de l’analyse de cette documentation nous permettra de valider ou non les hypothèses actuelles.

Sources : Searchengineland 28/05/24 ; Abondance 28/05/24 ; Le Petit Digital 29/05/24 ; Le JDN 30/05/24 ; Searchengineland 30/05/24

Découvrez des articles similaires

Derniers articles

Newsletter