Obtenez le modèle rédactionnel pour la création de contenu SEO performant Téléchargez le PDF

Doit-on avoir peur de Google BERT ?

Au sommaire
Par , le Vendredi 07 février 2020
Temps de lecture : 7 minutes

La dernière mise à jour de Google a plongé les experts SEO dans la confusion. Google considère cette mise à jour comme « l’un des plus grands pas en avant de l’histoire des moteurs de recherche ». Mais selon mon point de vue, l’impact de l’algorithme serait en réalité minime.

Alors que penser ?

Qu’est-ce que BERT ?

L'algorithme BERT est un réseau neuronal Open Source qui permet le traitement automatique du langage naturel. L’acronyme signifie « Bidirectional Encoder Representations from Transformers » et a été introduit par Google l’année dernière. 

BERT est une technologie qui permet notamment l’intégration des mots et leur désambiguïsation grâce au plongement de mots (word embedding). C’est sa qualité principale, malheureusement c’est aussi son plus grand défaut, car cette technique est exigeante en capacité de calcul et son utilisation à grande échelle est donc assez coûteuse.

Word2vec et les autres modèles permettent de précalculer les vecteurs de mots pour chaque phrase et de les enregistrer dans une base de données, de manière à pouvoir les extraire plus tard. Ce n’est pas le cas de BERT avec lequel il est nécessaire de systématiquement recalculer les vecteurs.

Quelle différence entre le word embedding (word2vec) et BERT ?

Voici un exemple :

  1. Phrase 1 : L'avocat rencontre plusieurs fois son client avant le procès.
  2. Phrase 2 : Pour bien choisir un avocat : attention à la couleur et à l’aspect.

Si je veux que l'algorithme comprenne la signification du mot “AVOCAT” qui désigne à la fois un métier et un fruit, avec le word embedding, il me suffit d’extraire LE vecteur pré-calculé de la base de données. Avec cette approche, il existe qu'un seul vecteur pour le même mot.

A contrario, BERT étant une technologie qui crée des vecteurs “contextualisés”, je vais devoir analyser les deux phrases dans le réseau BERT. BERT générera deux vecteurs très différents pour le mot “avocat” qui apparait dans deux contextes très distincts. On parle alors de désambiguïsation lexicale.

Grâce à sa capacité de désambiguïsation, BERT est à la pointe du progrès sur de nombreuses tâches de compréhension du langage naturel. Mais, cette compétence le rend également gourmand en calculs et donc difficile à exploiter. C’est pourquoi ce type d’algorithme est puissant dans l’analyse des questions ou la réécriture des contenus. Il a cependant des limites.

Ses besoins en calculs rendent son application dans les requêtes de recherche limitée, du moins pour l’instant. Il ne fait aucun doute qu’il y aura des améliorations dans un avenir proche et que les besoins en matière de traitement seront éventuellement réduits.

Comment BERT aide-t-il les internautes ?

La mise à jour Google BERT permet aux internautes d’obtenir de meilleurs résultats à partir de requêtes de type conversationnelles longues (Google est toujours tourné vers l'optimisation de la recherche vocale). Aujourd’hui, l’utilisation d’une suite de mot-clé sans structure n’est plus nécessaire pour se faire comprendre de Google.

Si la mise à jour Google BERT affecte directement les internautes, c’est plus compliqué en ce qui concerne les spécialistes du contenu. Google a amélioré sa compréhension du contexte, mais cela ne signifie pas qu’il vous faut commencer la rédaction de milliers de pages ciblant la longue traîne.

Cette mise à jour incite plutôt à continuer à écrire un contenu bien organisé, riche et complet.

Quels sont les effets de BERT chez les SEO ?

L’impact de cette mise à jour ne fait pas l’unanimité. Google affirme qu’il s’agit du “plus grand bond en avant des cinq dernières années” avec 10 % des résultats de recherche affectés par le changement.

Les consultants et experts SEO estiment quant à eux que l’impact sera minime. Ils ne prédisent pas de changements significatifs parce qu’ils ne contrôlent pas les requêtes conversationnelles de longue traîne. Ils surveillent la plupart du temps des phrases plus courtes et des termes principaux qui ne sont pas impactés par la capacité de traitement du langage naturel de BERT.

BERT est considéré comme une mise à jour majeure et il n’est donc pas surprenant que son arrivée s’accompagne d’une foule d’informations erronées. J’ai malheureusement déjà lu des communiqués d’expert SEO prétendant être spécialisés dans l’optimisation BERT. Suivre les conseils de ces experts mal avisés entraîne une perte de temps et d’argent dépensés dans la poursuite d’une stratégie peu judicieuse qui s’appuie sur de mauvaises tactiques.

Est-il possible d’optimiser pour BERT ?

Soyons clairs, BERT n’est pas un critère de classement. Et il n’est pas possible d’optimiser une page pour un facteur qui n’existe pas. BERT aide dans la compréhension des requêtes des internautes utilisant la longue traîne et, par conséquent, améliore la pertinence des résultats.

Les modèles BERT sont appliqués à la fois aux résultats de recherche organiques et aux featured snippets. S’il est possible d’optimiser les contenus pour ce type de requêtes, vous ne pouvez pas “optimiser pour BERT”.

Chez SEOQUANTUM, nous tenons compte de BERT, mais nous n’optimisons pas pour BERT.

Nous vous conseillons de vous concentrer davantage sur les expressions appartenant à la longue traîne et sur l'intention de recherche de l'internaute.

BERT n’est pas la seule raison de privilégier les mots-clés de longue traîne. Une page complète et riche apparaîtra toujours au moins sur quelques centaines de recherches. Voyez plutôt :

 

 

Cet article sur le traitement automatique du langage naturel est référencé sur plus de 100 mots-clés. L’utilisation accrue des termes de recherche de longue traîne dont : “traitement du langage naturel avec l’apprentissage automatique”, “NPL signifie traitement du langage naturel” et beaucoup d’autres permettrait d’améliorer son classement.

Maintenant, supposons que vous avez décidé de créer de nouveaux contenus, au lieu d’optimiser la page actuelle.

Quelle expression de longue traîne cibleriez-vous ?

Il existe de nombreuses expressions qui pourraient être ajoutées pour former des phrases qui “plairont” à BERT :

  • Le meilleur
  • Qu’est-ce qu’un bon
  • Comment trouver 
  • Pour les nuls
  • Pour les débutants

Ma prédiction concernant Google BERT

Google BERT affectera 20 % des recherches dans un délai d’un an, soit le double de son pourcentage actuel.

Les internautes utilisent souvent une suite de mots-clés, car ils pensent que Google comprend mieux ce type de requête. Pourtant, cela ne correspond pas vraiment à la façon dont ils poseraient naturellement une question. Ce n’est en effet pas naturel.

Alors que de plus en plus d’internautes découvriront la capacité de Google à comprendre les requêtes complexes, leur manière d’utiliser le moteur de recherche changera. En effet, ils passeront de l’emploi d’une suite de mots-clés à des phrases plus longues. C’est simplement dans la nature humaine.

Résumé

Les algorithmes de recherche de Google sont toujours plus sophistiqués c’est pourquoi il est de plus en plus difficile de réussir à “tromper” le moteur de recherche en ayant recours à des techniques peu recommandables.

La capacité à utiliser le contenu pour élaborer un récit est ce qui séparera les experts du marketing de contenu des amateurs. Chaque mise à jour Google offre des raisons supplémentaires de créer un meilleur contenu.

Un outil d’analyse sémantique comme SEOQUANTUM peut aider votre entreprise à produire des contenus de qualité et vous permet de booster votre autorité rapidement.

Plus de ressources au sujet de BERT :
https://www.webrankinfo.com/dossiers/google-search/bert
https://www.blog.google/products/search/search-language-understanding-bert/
https://towardsdatascience.com/bert-explained-state-of-the-art-language-model-for-nlp-f8b21a9b6270

Votez pour cet article
Moyenne des notes : 5 (2 votes)