La fuite Yandex : comment leurs facteurs de classement vous affectent
Publié: 2023-02-17Fin janvier 2023, un ancien employé de Yandex a divulgué une partie de leur référentiel de code source . Entre autres choses, cela a révéléplus de 1900 facteurs utilisés pour les classements de recherche.
Il s'agissait de la plus grande fuite dans la communauté de recherche depuis la fuite des journaux de recherche d'AOL en 2006, ce qui a donné un aperçu hilarant, dramatique et assez dérangeant du comportement des chercheurs. Pour les référenceurs observateurs, la fuite Yandex a fourni une première du genre ; un exposé sous le capot dufonctionnementd'un moteur de recherche .
Certes,Yandex n'est pas Google,mais les informations tirées de l'étude des critères de classement divulgués peuvent aider tout SEO à comprendre comment les moteurs de recherche interagissent réellement avec les sites Web et le contenu qu'ils produisent.
Lisez la suite pour découvrir nos principaux enseignements de la fuite de Yandex et comment ils peuvent vous aider à améliorer votre référencement.
Qu'est-ce que Yandex ?
Yandex est la plus grande entreprise technologique de Russie et est surtout connue pour son moteur de recherche du même nom. Tout comme avec Google, la société a en fait de nombreux intérêts et investissements connexes en plus de la recherche, de la publicité et des e-mails aux voitures autonomes et aux appareils intelligents.
Yandex détient une part de marché mondiale comprise entre 0,85 % et 1 % fin 2022.
Ceci, bien sûr, n'est rien en comparaison de la part de marché de 93% de Google, mais ce n'est pas trop loin des 3% de Bing et des 1,5% de Yahoo.
En Russie, cependant, les chiffres racontent une histoire différente, Yandex représentant 62,6 % de toutes les recherches en Russie entre octobre 2022 et décembre 2022.
Fait important pour ceux qui ne sont toujours pas sûrs de la pertinence de cette fuite à la lumière de la domination de Google, Yandex a été créé par un groupe d'anciens Googleurs.
Ils embauchent tout le temps des ex-Googlers, assistent aux mêmes conférences… La pollinisation croisée des idées et des méthodes est inévitable dans cette optique.
Quels secrets la fuite Yandex a-t-elle révélés ?
Eh bien, cela a révélé beaucoup et pas grand-chose. Réponse SEO typique, hein ?
Parmi les 1 922 facteurs de classement de recherche divulgués, il y avait des inclusions surprenantes et moins surprenantes.
Vous voulez passer en revue les 1 922 facteurs de classement ? Consultez cette feuille de calcul, y compris une ventilation de chaque facteur ici.
Yandex a gratté Google
Le premier élément clé à retenir est que Yandex a gratté Google et d'autres grands sites.
C'est important et cela pourrait amener certains référenceurs à rejeter les résultats . Après tout, si ce n'est qu'une copie de Google, pourquoi ne pas se concentrer uniquement sur Google ?
Le fait est queYandex n'est pas Google,et rien n'indique qu'ils ont directement utilisé les données dans leurs propres résultats. Au lieu de cela, il est beaucoup plus probable qu'ils aient utilisé les données pour comparer leurs propres résultats à ceux de Google .
Yandex partage des similitudes structurelles avec Google (encore une fois, ce qui n'est pas surprenant compte tenu des ex-Googlers impliqués), ce qui signifie que ces révélations peuvent toujours être applicables même lors de l'optimisation pour d'autres moteurs que Yandex.
Les facteurs de classementspécifiquesont été révélés
Parmi les facteurs les moins surprenants figuraient des éléments tels que :
- Classement
- Clics
- Âge du lien
- Âge du contenu
- Pertinence du lien
- Pertinence textuelle
- Fiabilité du site Web
- Expérience utilisateur
- Temps de séjour
- Sites préférentiels (ex. Wikipédia)
Certains des résultats les plus surprenants et les plus utiles sont ceux qui ont révélé à quel point Yandex met l'accent sur les mesures liées à la qualité.
Malte Landwehr l'a facilement décomposé dans ce fil:
Dans le code source divulgué de Yandex, il y avait plus de 40 facteurs de classement liés à la qualité.
Il y a principalement divisé en qualité de:
• héberger
• pages
• textePlongeons dans #YandexLeak pic.twitter.com/sfrATl0ROo
– Malte Landwehr (@MalteLandwehr) 29 janvier 2023
La « qualité » était principalement axée sur trois piliers clés :
- Qualité de l'hôte
- Qualité des pages
- Qualité du texte
La qualité de l'hébergeur fait référence à la qualité déterminée du site générant le lien. Ceci est évalué à travers un certain nombre de sous-points différents, y compris la fraîcheur et la qualité du contenu du lien.
La qualité de la page inclut le statut 404 des pages, les liens rompus et le matériel intégré rompu.
La qualité du texte comprend l'exactitude grammaticale de la copie, la pertinence contextuelle et s'il a été généré ou non par l'IA.
Les facteurs de classement ont une pondération définie
Non seulement la fuite a révélé les facteurs de classement, mais elle a également révélé la pondération définie pour eux.
Plus fort pour les personnes à l'arrière :
LES POIDS POUR LES FACTEURS DE CLASSEMENT DE YANDEX SONT DANS CETTE CHOSE ! https://t.co/HLrQ2z5UeJ
– Mic King (@iPullRank) 29 janvier 2023
Nous savons depuis longtemps que tous les facteurs de classement ne sont pas créés égaux, mais il est fascinant de pouvoir voir cela de manière si définitive.
Nous avons créé un graphique à emporter pratique des 5 principaux facteurs de recherche positifs et négatifs de Yandex basé sur l'excellent résumé de Michael King ici .
Que devraient apprendre les référenceurs de la fuite Yandex ?
La recherche est encore plus dynamique que vous ne le pensez
Nous nous sommes concentrés sur les 1 900 facteurs divulgués, mais la base de données Yandex contient bien plus que cela. Pris ensemble, le nombre total de facteurs disponibles dépasse 18 000 et peut même dépasser 20 000.
Le fait est que tous ces éléments ne sont pas en jeu en même temps. Bien sûr, certains sont obsolètes, mais beaucoup ne le sont pas, et ils sont utilisés de manière dynamique pour mieux correspondre à la requête de l'utilisateur.
Différents facteurs peuvent avoir une importance différente en fonction de la structure et de l'intention déduite de la requête de l'utilisateur.
Cela ne devrait pas vraiment être surprenant, mais cela vaut la peine d'intérioriser. Avec autant de facteurs, il est tout simplement impossible pour quiconque de bien comprendre. C'est fonctionnellement une boîte noire à ce stade.
Cela ne devrait cependant pas décourager les référenceurs. Avec cette fuite, vous pouvez voir d'où ils partent et vous pouvez voir les efforts qu'ils déploient pour s'assurer que la qualité est prioritaire par-dessus tout.
Il existe des mesures pour la qualité du site, la qualité des liens et la qualité du contenu.
Il est rassurant de savoir qu'avec le temps, un contenu de bonne qualité devrait toujours se hisser au sommet et être dûment mis en évidence à la fois dans les résultats de recherche et dans l'autorité récompensée par les liens provenant d'un contenu de si bonne qualité.
La sur-optimisation est un détriment actif pour votre domaine
Celui-ci est grand.
Les pondérations susmentionnées ont non seulement une échelle préférentielle, elles ont également défini des limites supérieures.
Il est en fait possible d' obtenir un score trop élevé pour certains facteurs, ce qui les amène à avoir une influence négative sur votre site.
Les facteurs avec des bornes supérieures sont des facteurs classiques ciblés par les référenceurs pour l'optimisation. Textes d'ancrage, CTR, densité de mots-clés - tous ces éléments ont des limites supérieures à partir desquelles ils deviennent un net négatif pour votre domaine.
Cela devrait en fait rassurer les référenceurs qui ne se livrent pas à des techniques de chapeau noir ou de spam. Une optimisation à ce point extrême ne peut se produire que si vous manipulez activement vos liens entrants et surchargez votre site. Les référenceurs intelligents savent qu'il ne faut pas le faire et seront soulagés de voir que d'autres sites seront activement punis pour avoir adopté ce comportement.
Je sais que Yandex n'est pas Google, et je sais que j'ai une semaine de retard à la fête, mais la chose qui m'a le plus marqué dans la fuite de l'algorithme Yandex est le facteur de classement "pourcentage de vues du site à partir de la recherche".
Devoir. Diversifier. Sources de trafic.
– Luke Jordan (@lr_jordan) 6 février 2023
La sur-optimisation doit être évitée, un profil de backlink diversifié étant bien récompensé.
Par exemple, dans vos campagnes de création de liens, vous devez toujours chercher à imiter l'acquisition naturelle avec votre stratégie de création de liens .
Les résultats locaux sont proches de chez vous
Sur les 1 922 facteurs divulgués, 319 peuvent être directement attribués à des services de recherche ou de localisation locaux .
Bien sûr, tous ces facteurs ne seront pas pertinents pour chaque recherche, mais cela montre à quel point le moteur se donne beaucoup de mal pour garantir la pertinence géographique des résultats des internautes.
Les référenceurs doivent garder cela à l'esprit lors de l'optimisation des sites et des liens de leurs clients. Les listes de profils d'entreprise Google, la création de citations locales et l'optimisation sur la page sont toutes d'une importance vitale pour vous assurer que vous fournissez des résultats pertinents localement aux chercheurs locaux.
Google n'est pas l'alpha et l'oméga de la recherche
Entre ce rappel opportun et la résurgence de Bing alimentée par ChatGPT, il est important de se rappeler que Google n'est pas leseulmoteur de recherche. America Online, Yahoo, même Ask Jeeves. Tous ces moteurs de recherche sont venus et repartis. Il n'y a pas de "too big to fail" et cela s'applique même à Google.
Tous les quelques mois, nous entendons parler de changements monumentaux potentiels dans la Silicon Valley, tels que les audiences en cours sur l'article 230 . Chacune de ces contestations devant la Cour suprême a le potentiel de changer fondamentalement la recherche, et même l'essence même d'Internet, à tout moment.
Les référenceurs doivent toujours rester attentifs aux changements potentiels, à la fois au sein de Google et en dehors, et il est important de garder le doigt sur ce qui se passe ailleurs également.
Ce potentiel d'intervention politique mène au point suivant…
La politique de la recherche
Un aspect peut-être sous-estimé de la fuite de Yandex est l'aperçu de la politique de recherche.
Notamment, Yandex considère qu'un utilisateur est russe s'il utilise la version en langue russe en Ukraine, en Biélorussie ou au Kazakhstan.
Des trucs plus intéressants de #YandexLeak. Yandex vous considère comme ruzzia si vous êtes en Ukraine, en Biélorussie ou au Kazakhstan et que vous utilisez l'interface rus et la langue rus pic.twitter.com/S040gjEbMI
– RayzRazko13 (@RayzRazko13) 6 février 2023
Dans le contexte de la situation géopolitique actuelle, c'est une grande déclaration qu'ils font fondamentalement au nom de leurs utilisateurs.
Cela s'ajoute à des rapports selon lesquels Yandex ferme activement les requêtes impliquant Poutine de manière désobligeante ou obscène .
Peut-être que l'un des facteurs de recherche positifs est FI_IS_NOT_RU : +0.08128946612. Ce facteur le marque en fait comme positif si le domainen'est pasrusse. Cela semble étrange, mais cela montre certainement que les classements sont une confluence déroutante de facteurs.
Google s'est donné beaucoup de mal avant de déclarer qu'il ne permettait pas au sentiment politique d' influencer indûment ses résultats , mais les révélations de Yandex sont un rappel important du pouvoir que détiennent les sociétés de recherche, agissant comme elles le font comme des autoroutes vitales vers l'information, auxquelles de nombreux utilisateurs font aveuglément confiance. leur fournir les résultats les plus pertinents.
Le but ici n'est pas de s'enliser dans la politique d'un sujet spécifique, mais plutôt de se souvenir de l'influence de ces moteurs sur nos vies et de la manière dont les interactions avec eux doivent être abordées en conséquence.
Nous voyons comment les programmes d'IA adoptés non seulement par Google mais aussi par Bing peuvent être incorrects, manipulés et même activement tournés vers des contenus nuisibles ou trompeurs. Il faut garder cela à l'esprit , qu'il s'agisse d'un comportement accidentel ou intentionnel de ceux derrière les moteurs.
La fuite Yandex devrait-elle affecter votre stratégie de référencement ?
Les mises à jour dans le monde de la recherche ne devraient jamais signifier que vous faites des réactions instinctives et ce n'est pas différent.
Même si Yandex est plus petit que Google, les informations fournies ici sont toujours utiles pour aller de l'avant, en particulier en voyant comment les facteurs de classement s'influencent les uns les autres et agissent de manière dynamique et non statique.
Il est peu probable que les facteurs de classement de Yandex indiquent à eux seuls une erreur grave dans votre plan d'optimisation pour Google, mais ils sont certainement matière à réflexion. La seule raison pour laquelle cela devrait vous amener à ajuster votre stratégie est si ces fuites vous ont soudainement fait réaliser que vous avez commis une erreur spécifique dans votre projet.
Au lieu de cela, utilisez-le comme une opportunité d'apprendre ce que les moteurs de recherche recherchent. Si vous vous demandez comment naviguer dans le référencement tout en évitant les répercussions négatives, vous pouvez sous-traiter vos livrables SEO à des experts pour plus de tranquillité d'esprit.