Le 13 mai 2024, une fuite de documents Google, révélée par yoshi-code-bot sur Github, nous a offert un aperçu sans précédent de la recherche sur Google et a révélé leurs éléments importants pour classer les contenus. Voici un récapitulatif ce que nous savons de ces documents.
Aperçu de la fuite
Nous savons que cette documentation est actuelle, en raison de la date des documents. L’API contient 2 596 modules et 14 014 attributs. Elle ne révèle que l’existence des critères de classement mais pas leur importance relative. Cependant, elle indique des fonctions de reclassement qui peuvent « ajuster le score » ou « modifier le classement » d’un document, selon Michael King d’iPullRank.
Ainsi, le contenu peut être rétrogradé pour différentes raisons, telles que des critiques sur un produit, des liens erronés ou d’autres signaux des SERP (Search Engine Result Pages), qui indiquent l’insatisfaction des utilisateurs.
Conservation et historique des pages
Selon cette documentation, Google conserve une copie de toutes les versions de toutes les pages qu’il n’a jamais indexées. Cela signifie qu’il « se souvient » de toutes les modifications apportées à une page, bien qu’il n’utilise que les 20 dernières modifications d’une URL lors de l’analyse des liens.
Critères de classement
Diversité et pertinence des liens
Les documents montrent que :
- la diversité et la pertinence des liens restent essentielles.
- le PageRank est toujours très présent dans les fonctions de classement de Google.
- le PageRank de la page d’accueil est pris en compte dans chaque document.
Google utilise diverses mesures pour les liens, notamment les BadClicks, les GoodClicks, les LastLongestClicks et les UnsquashedClicks. Pour résumer, les clics réussis restent très importants pour Google !
Longueur et originalité des contenus
Quand on parle de contenus, les documents les plus longs peuvent être tronqués, tandis que les contenus plus courts reçoivent une note (de 0 à 512) basée sur l’originalité. À propos de cette dernière, il faut comprendre la notion d’EEAT (Experience, Expertise, Authoritativeness, and Trustworthiness).
Importance de la marque et de la notoriété
Il est important de se souvenir que la marque compte et que sa notoriété devrait être construite aussi en dehors des pages de résultats des moteurs de recherche. Google utilise les entités nommées, ainsi qu’un critère appelé « siteAuthority », révélé par l’update Panda qui a touché beaucoup de sites à contenu dit « médiocre ».
Utilisation des données de Chrome
Sans vouloir rendre paranoïaques les utilisateurs de Chrome, le module ChromeInTotal indique que Google utilise les données de son navigateur Chrome pour le classement.
Caractéristiques intéressantes révélées
Voici quelques-unes des caractéristiques intéressantes présentes dans le document :
- BylineDate, SyntacticDate, SemanticDate : la fraîcheur du contenu compte.
- SmallPersonalSite, RegistrationInfo : il semblerait que des petits sites d’experts puissent être mis en avant.
- SiteRadius, SiteFocusScore : savoir si un document est un sujet central du site web.
- TitlematchScore, AvgTermWeight : l’information centrale de la page compte.
- AnchorMismatchDemotion, CompressedQualitySignals, TopicEmbeddingsVersionedData : la pertinence des liens.
- LocalCountryCodes : les liens locaux (provenant du même pays) ont probablement plus de valeur.
- FullRightContext : le contenu qui entoure un lien donne le contexte du texte d’ancrage.
Répercussions sur le SEO
Pour essayer de répondre à la question de l’évolution du SEO suite à cette fuite, nous pensons que oui, il évoluera. En effet, basé essentiellement sur des tests and learn, le SEO pourra confirmer ou infirmer des hypothèses et progresser plus rapidement qu’auparavant.
Conclusion
Dixon Jones, PDG d’Inlinks, a rendu consultables les 14 014 variables de recherche de Google pour nous permettre de savoir quels éléments Google stocke et à quoi ils servent. Il est important de se souvenir que ces caractéristiques ne sont pas pondérées dans la documentation. Il est aussi impossible de savoir lesquels sont utilisés en production et lesquels pourraient exister à des fins expérimentales.
Pour être bien classé, il faut se souvenir que la pertinence et l’expérience utilisateur restent les objectifs principaux.
Rossitza Mavreau, Lead Traffic Manager SEO SEA Analytics chez UX-Republic
Sources: