SEOQuantum Open Nav

Fonctionnement et historique de l’algorithme de recherche Google

Par
le Jeudi 10 février 2022
Pour résumer :
Temps de lecture : 19 minutes

Vous voulez améliorer la visibilité de votre site internet de façon pérenne ? Si c’est le cas, vous devez comprendre le fonctionnement des algorithmes de Google. En effet, c’est en connaissant les attentes du moteur de recherche et en respectant ses directives que vous pourrez profiter d’un bon référencement naturel. Dans cet article, je vous explique tout ce que vous devez savoir sur l’algorithme de recherche de Google. Je vous décris ensuite en détail les 13 mises à jour qui ont influencé à tout jamais le SEO.

🕸 Quelques mots sur Google 

Qu'est-ce que Google ?

Si vous voulez comprendre comment fonctionne l’algorithme de Google, vous devez d’abord connaître quelques bases concernant le moteur de recherche. Une fois que vous avez une vision globale de son fonctionnement, il est alors plus simple d’assimiler les différentes évolutions qu’a connues ce géant du Web. Aujourd’hui basé dans l’imposant Googleplex à Mountain View (Californie, USA), le concept a été lancé en 1998, dans un garage bien plus rustique. C’est à cette époque que Larry Page et Sergeï Brin ont eu la géniale idée de créer un outil permettant de regrouper les informations disponibles sur Internet.

En rassemblant toutes ces données et en les proposant de manière organisée aux internautes, ils ont définitivement marqué l’histoire du Web. Pour mettre au point ce moteur de recherche encore un peu rudimentaire, ils ont créé le tout premier algorithme de recherche en ligne. Depuis, même s’il a énormément évolué, son principe est resté le même. Il est basé sur un système comparable à une araignée qui parcourt sa toile (web en anglais !) et composé de trois étapes fondamentales.

  1. L’exploration : le robot de Google (appelé Googlebot) parcourt l’ensemble de la Toile afin de trouver toutes les pages internet (selon les dernières statistiques, il y en aurait plus de deux milliards à l’heure actuelle). Pour aller de page en page, il a besoin de liens externes et internes, d’où l’importance du netlinking et du maillage interne.
  2. L’indexation : les informations collectées par le robot d’indexation de Google sont alors analysées selon de nombreux critères, tels que le champ lexical (les fameux mots-clés !) ou la présence d’images. Cela permet de regrouper tout ce contenu dans une immense base de données
  3. Le positionnement : lorsqu’un internaute soumet une requête dans la barre de recherche, Google analyse ses pages indexées pour tenter de fournir les meilleures réponses possibles. C’est principalement ici que les algorithmes rentrent en compte et sont primordiaux pour ce qu’on appelle aujourd’hui le référencement naturel.

Astuce : même si votre page n’apparaît pas dans les résultats de recherche, elle peut être indexée. Pour savoir si c’est le cas, il vous suffit de taper la requête suivante dans la barre de recherche de Google : site:MONSITE.xxx.

💡 Le fonctionnement des algorithmes de Google

Fonctionnement des algorithmes de Google

Sachez tout d’abord qu’il n’y a pas un seul algorithme, mais des centaines ! Tous ces algorithmes sont empilés les uns sur les autres et fonctionnent soit de manière combinée soit de façon indépendante. S’en est arrivé à un tel point que même les ingénieurs de Google ne savent pas exactement comment fonctionne ce processus complexe et ce qui influence réellement le ranking des pages dans la SERP. De ce fait, certaines mises à jour algorithmiques ont même parfois un effet de « rétropédallement » sur le classement de Google.

Ce que l'on sait, c'est qu'en fonction de la thématique recherchée et de l’intention de requête, certains de ces algorithmes sont favorisés afin de transmettre une réponse explicite. D’après les informations transmises sur le blog de Google, il y aurait des centaines de milliards de pages indexées dans leur « bibliothèque » géante ! Il leur a donc été nécessaire de créer des formules précises qui permettent de résoudre ce tri de manière rapide et efficace. Parmi tous ces paramètres, cinq facteurs semblent déterminants.

1. L’analyse des termes de recherche

En se basant sur de complexes modèles linguistiques, Google parvient à comprendre le sens de la requête et les chaînes de mots devant être recherchés dans l’index. Il leur est également possible de déterminer le type d’informations souhaitées : actualité, local, image, achat, etc. À noter encore que l’intelligence artificielle est arrivée à un tel point que les fautes d’orthographe sont interprétées de façon correcte et que la prise en compte de synonymes soit possible en temps réel.

2. La recherche de correspondance

Une fois votre requête comprise, Google effectue une recherche de correspondance au sein de l’ensemble des pages indexées. En se basant sur les mots que vous avez choisis, une analyse approfondie du champ lexical est faite afin de retrouver ces mêmes termes dans les textes et dans les titres. Un contrôle externe et indépendant permet par ailleurs de déterminer l’intérêt des résultats affichés et de constamment faire évoluer la pertinence de la SERP (Search Engine Result Page).

3. Le classement des pages selon leur utilité

C’est à ce moment que rentrent en jeu les algorithmes qui intéressent tous ceux qui veulent être visibles sur Internet grâce au SEO. Des centaines de critères de classement de Google, plus ou moins connus, sont utilisés afin de contrôler la qualité des pages indexées. Ces critères sont pour la plus grande majorité basés sur ce qu’on appelle les trois piliers du référencement naturel, à savoir la technique, le contenu et la popularité.

4. L’affichage des meilleurs résultats

En fonction des trois éléments précédents, Google a déjà fait un grand tri grâce à ses différents algorithmes. Toutefois, les ingénieurs de Mountain View souhaitent proposer la meilleure expérience utilisateur possible aux googleurs. De ce fait, avant même d’afficher les résultats, la prise en compte d’autres facteurs intervient telle que l’affichage sur les différents navigateurs ou appareils de lecture numérique et si le temps de chargement est correct même pour les connexions internet lentes.

5. La prise en compte du contexte

Dernière étape avant l’apparition de la page de résultats du moteur de recherche, votre contexte personnel est pris en compte. En effet, Google s’intéresse à votre position actuelle, à votre historique de recherche et l’actualité proche de vous pour fournir une information personnalisée. Même si ce système est controversé, il est vrai que c’est plutôt agréable d’avoir des propositions qui nous correspondent. Pour obtenir des résultats plus neutres, vous pouvez utiliser la fonction de navigation privée.

Si vous souhaitez avoir plus de détails sur chacun de ces sujets, je vous propose de suivre ce lien : https://www.google.com/intl/fr/search/howsearchworks/algorithms/.

⚠ Les 13 mises à jour de Google à connaître

Infographie : principales mises à jour de l'algorithme de Google

Depuis la création de Google en 1998, les algorithmes n’ont cessé d’évoluer. Les deux principales motivations de ces mises à jour sont de proposer les résultats les plus en adéquation avec les intentions de recherche et d’empêcher les référenceurs de profiter des failles découvertes (comme le bourrage de mots-clés ou l’achat massif de liens externes). Avant 2010, les spécialistes du SEO s’intéressaient principalement à la barre d’outil appelée PageRank. Cependant, même si ce facteur reste à la base du fonctionnement des algorithmes, son affichage a aujourd’hui disparu de la SERP.

Depuis, il y a certainement eu des centaines de mises à jour, dont la plus grande majorité n’a même pas été dévoilée. Toutefois, certaines ont eu un tel impact sur le référencement organique qu’elles sont absolument nécessaires à connaître. Voici la liste des 13 principales mises à jour que vous ne pouvez pas ignorer si vous voulez être visible sur Google. Sachez néanmoins qu’aucun algorithme de Google n’est dévoilé dans son intégralité et que seules des directives sont publiées afin de permettre aux propriétaires de sites internet de s’adapter aux changements.

1. Page Experience Update

En juin 2021, Google annonçait la mise en place d’un nouvel algorithme qui prendrait en compte l’expérience utilisateur sur les pages web. Les signaux émis lors de l’utilisation deviennent donc un facteur pouvant influencer le référencement naturel. La simplicité de navigation, la lisibilité, la publicité sont par exemple des éléments qui ont leur importance en SEO. La mise à jour se base sur les signaux web essentiels que sont LCP (Largest Contentful Paint), FID (First Input Delay) et CLS (Cumulative Layout Shift). Pour en savoir plus, rendez-vous sur ce lien.

2. Google Core Updates

Entre 2018 et 2021, six mises à jour de l’algorithme ont été appelées « core update » en raison de leur impact majeur sur l’affichage de la page des résultats de Google, et donc du référencement naturel. Pour chacune, l’algorithme de Google a été revu en profondeur, d’où leur importante influence sur la SERP.

2.1 November 2021 Core Update

En novembre 2021, cette mise à jour de l’algorithme a été largement controversée, car elle a eu lieu en même temps que le Black Friday. C’est ainsi à un moment crucial du commerce en ligne que les premiers changements ont pu être observés, ce qui a amené de nombreuses plaintes des acteurs concernés. Un impact a, semble-t-il, principalement été remarqué sur les sites du secteur médical, même si Google est resté très vague sur les changements apportés (comme à son habitude !). 

2.2 June & July 2021 Core Updates

Une fois n’est pas coutume, cette mise à jour de l’algorithme de Google a été lancée en deux phases, l’une en juin et l’autre en juillet 2021. Les effets de ces changements n’ont cependant pas été aussi importants que ce que les spécialistes du SEO attendaient. Certains domaines, comme les sites de streaming ou de musique, ont vu leur visibilité augmenter. En revanche, d’autres domaines, comme le commerce en ligne ou les sites de traduction ont vu leur trafic organique diminuer. 

2.3 December 2020 Core Update

En décembre 2020, une mise à jour concernant le calcul de la qualité du contenu, la performance technique, l’arborescence des sites et l’UX (expérience utilisateur) a été annoncée. Crainte par tous, ces effets ont cependant été bien en dessous de ce qui était escompté. Le but de cette core update était de tenter d’améliorer la façon dont les robots d’indexation positionnent les pages sur le moteur de recherche

2.4 September 2019 Core Update

Annoncée sur Twitter le 24 septembre 2019, l’effet de cette mise à jour s’est étonnamment montré plutôt positif pour les sites jusqu’alors mal positionnés. Il semblerait que ceux qui avaient largement souffert de pénalités antérieures ont alors connu un ressaut dans la SERP. C’était donc une très bonne nouvelle pour tous les sites internet qui avaient eu jusque-là de la peine à se remettre d’un déclassement lié à des pratiques abusives.

2.5 June 2019 Core Update

C’est la toute première fois que le moteur de recherche choisit d’annoncer une core update sur le Twitter officiel de Google. Les thèmes abordés étaient alors la vitesse de chargement (pour lequel l’impact SEO n’est toujours pas démontré), le HTTPS (à nouveau aucune réelle influence constatée) et sur la pertinence du contenu proposé. C’est précisément sur ce dernier point que les changements principaux ont été le plus observés. Un autre grand chamboulement a été l’apparition plus fréquente des résultats YouTube au sommet de la SERP.

2.6 August 2018 Core Update

Également appelée Medic Update, cette mise à jour de l’algorithme de Google concernait principalement les sujets les plus sensibles, tels que la santé, la finance et l’e-commerce. L’objectif était de renforcer la sécurité de l’internaute en ce qui concerne des thématiques pouvant engendrer des résultats dramatiques. Toutefois, Google aura ensuite informé le public que celle-ci devait avoir une influence sur l’ensemble des sites et pas non seulement sur les pages alors appelées YMYL (Your Money Your Life). 

Si vous avez le sentiment que votre site internet a été fortement impacté par une core update, Google a publié un guide de mesures à prendre en considération que vous trouverez ici : https://developers.google.com/search/blog/2019/08/core-updates

3. Google BERT

Annoncée officiellement en France le 9 décembre 2019, BERT démontre à quel point le moteur de recherche tend de plus en plus à s’apparenter à une intelligence artificielle d’une grande complexité. La mise en place de cette nouvelle technologie (Bidirectional Encoder Representations for Transformers) est de pouvoir intégrer les mots et de les désambiguïser grâce au plongement des mots. Cela permettrait donc à l’internaute de profiter d’un meilleur affichage pour les requêtes vocales ou présentant des erreurs. Son effet sur le SEO n’a cependant pas été aussi important que ce qu’avait annoncé Google.

4. Google Rankbrain

Présentée en octobre 2015 comme une extension de Google Colibri (point 7), Rankbrain est un système d’apprentissage automatique visant à améliorer la pertinence des résultats de recherche. Cette technique permet alors à Google de mieux comprendre les requêtes de longue traîne ou des phrases qui n’avaient jusqu’alors jamais été recherchées. Cette mise à jour a aujourd’hui une grande influence sur la rédaction web, en favorisant le champ lexical et la sémantique au simple mot-clé. C’est d’ailleurs un des domaines dans lequel l’outil SEOQuantum excelle !

5. Google Pigeon

Image d'illustration de Google Pigeon

Apparu aux États-Unis en 2014, ce nouvel algorithme n’a été mis en place en France qu’en juin 2015. il a principalement eu un impact sur les entreprises et les commerces locaux. Cette étape représente également le début de l’importance des fiches Google MyBusiness. En effet, cette mise à jour de Google a commencé à prendre en considération les données géographies de l’utilisateur afin de proposer des résultats géolocalisés. Son influence a alors été autant remarquée dans la SERP que sur Google Map.

6. Google Phantom (ou Google Quality)

Image d'illustration de Google Phantom

Également connue sous le nom de Quality, cette mise à jour a d’abord été niée par Google. Pourtant, en mai 2015, le monde du SEO s’était vu totalement bouleversé à cette période. D’où le fait que cette mise à jour est d’abord été nommée « Fantôme ». Même si aucune précision n’a été donnée, les ingénieurs ont ensuite admis que l’algorithme avait été modifié afin d’améliorer l’analyse de la qualité du contenu proposé par les pages de résultats du moteur de recherche.

7. Mobile Friendly

C’est le 21 avril 2015 que Mountain View annonce la mise en place de son nouvel algorithme visant à favoriser les sites ayant une bonne compatibilité avec les mobiles. Mise en place en temps réel et page par page, c’est avec effroi que certains propriétaires ont vu leur visibilité sur Internet dégringoler jour après jour. Depuis lors, il est devenu essentiel pour un site web d’être compatible avec l’affichage sur les mobiles et tablettes. La révolution du classement dans la SERP a été telle que cette mise à jour a même été surnommée « mobilegeddon» (en référence à Armageddon).

8. Google Hummingbird

Image d'illustration de Google Colibri

C’est en septembre 2013 que l’une des mises à jour les plus importantes de l’algorithme de Google a été lancée. Connue sous le nom de Colibri en français, cette véritable révolution a permis d’améliorer autant la qualité que la rapidité des résultats recherchés. Les requêtes de l’internaute sont mieux comprises, même lorsqu’elles sont complexes ou uniques. C’est pourquoi Rankbrain, déployée deux ans plus tard, est considéré comme la suite logique de Google Hummingbird

9. Google Payday

Payday représente le début officiel de Google dans sa lutte contre le spam. En effet, c’est en juin 2013 que le moteur de recherche décide de tout simplement retirer des pages de résultats contenant les informations assimilées au spam. Sont ainsi concernées les thématiques suivantes : crédits, contrefaçon, jeux en ligne, etc. C’est donc à ce moment que Google affirme pour la première fois son ambition de vouloir protéger l’internaute des sites à caractères dangereux pouvant avoir un effet négatif sur le bien-être de l’utilisateur.

10. Exact Match Domain

Avant septembre 2012, si vous appeliez votre site « chaussure-de-course-pas-cher », vous auriez été largement favorisé pour votre référencement naturel sur cette requête exacte. Google a changé la donne en lançant une nouvelle mise à jour de son algorithme. L’influence de l’URL a donc considérablement été réduite afin de promouvoir avant tout du contenu pertinent et de qualité. Aujourd’hui, l’importance des adresses des pages web ne semble plus que jouer un rôle mineur en référencement naturel.

11. Google Penguin

Image d'illustration de Google Pingouin

Officiellement lancé en avril 2012, le nouvel algorithme Penguin (pingouin en français) a complètement transformé le référencement naturel. Ce filtre de recherche a pour but de pénaliser les sites internet qui ne respectent pas les directives de Google. L’objectif était clairement de lutter contre la création de backlinks faite de manière abusive (échange et achat de liens). Les développeurs de site internet et autres webmasters ont alors dû passer un temps fou à désavouer les liens litigieux et à nettoyer leurs propres sites.

12. Google Panda

Image d'illustration de Google Panda

Ce tout premier filtre de recherche connu du grand public a été mis en place en février 2011. L’objectif de Google Panda est de fournir du contenu de haute qualité. La tactique de Google a donc été de pénaliser les sites web qui ont abusé du bourrage de mots-clés (ce qui était déjà contraire aux recommandations faites par le moteur de recherche !). L’effet de ce nouvel algorithme a eu un immense impact sur le positionnement de millions de pages internet et son influence se fait ressentir aujourd’hui encore.

13. Google Caffeine

Image d'illustration de Google Caffeine

Google Caffeine (caféine en français) est la première révolution des mises à jour de l’algorithme Google. Déployée en juin 2010, elle sert principalement à accélérer le processus d’indexation. En effet, dorénavant, une page peut immédiatement être indexée après avoir été parcourue (crawlée) par le Googlebot. Grâce à cette évolution, l’actualité des informations transmises sur le moteur de recherche s’est vue considérablement améliorée.

🎬 Conclusion

Le leader des moteurs de recherche est en perpétuelle évolution. Il semble que l’objectif de l’ensemble des algorithmes de Google tend vers une amélioration des facteurs qui sont pour Mountain View les plus importants.

  • Proposer du contenu de qualité.
  • Analyser le champ lexical et la sémantique des textes.
  • Garantir la sécurité de l’internaute.
  • Améliorer l’expérience utilisateur.
  • Lutter contre les fraudes.

Si vous voulez que votre site internet soit visible sur le moteur de recherche, vous devez donc constamment vous tenir au courant des mises à jour des algorithmes. Et la clé de la réussite, c’est de suivre scrupuleusement les recommandations faites par les informaticiens de Google. Vous l’aurez peut-être remarqué, je n’ai pas parlé de Google EAT dans ce billet de blog. C’est tout simplement car, plus qu’un algorithme, il décrit avec précision la bonne marche à suivre en SEO. Si vous souhaitez en savoir plus à ce sujet, je vous propose de lire l’article suivant : https://www.seoquantum.com/billet/google-eat.

Besoin d'aller plus loin ?

Vous avez besoin d'appronfondir le sujet : l'équipe éditoriale vous recommande les 5 contenus suivants :

Moyenne des notes : 5 (3 votes)

Alors, prêts à booster votre référencement naturel ?

Testez notre version d'essai

Essayer gratuitement pendant 14 jours
SEOQuantum