Améliorer son positionnement sur les moteurs de recherche grâce à l'analyse sémantique

Anthony SEOQuantum

Je me lance un véritable défi à travers cette série de 6 tutoriels : vous faire partager ma passion pour la sémantique et le SEO en 6 semaines seulement.

L'objectif est de vous initier au fonctionnement sémantique du moteur de recherche Google ainsi qu'à l'optimisation de vos stratégies SEO et de vos contenus. En avant pour le premier tuto :-)

Longtemps, on a pensé que l’optimisation sémantique pour le référencement naturel se limitait à l’écriture des balises title, et Hn. Depuis l’avènement de Google Panda, visant à sanctionner les sites de faible qualité, le contenu est devenu l’une des préoccupations majeures des SEO.  Désormais, le moteur de recherche prend en considération la richesse sémantique intrinsèque liée au mot-clé cible. Comment produire des contenus de qualité et surtout efficaces d’un point de vue SEO ? Comment le moteur de recherche perçoit-il ce contenu ? Que souhaite-t-il réellement ?

SEOQuantum : la naissance d'un outil

De ces questionnements, nous avons fait naitre un outil : SEOQuantum. Il s’agit d’un outil d’aide décisionnelle à la rédaction de contenu. Mais comment fonctionne-t-il ? 

Afin d’être le plus pertinent possible, le moteur de recherche considère la qualité perçue par les internautes lors des visites des sites web. Le souhait de Google est avant tout de mettre en avant des contenus de qualité, afin de répondre à l’attente de l’internaute. De ce constat, il est essentiel d’étudier ce qui plait à Google et d’analyser les pages que l’on trouve dans le TOP des SERP afin d’en extraire les principaux champs lexicaux. Pour plus de détails sur le fonctionnement du moteur, je vous invite à lire mon article sur Rankbrain et l'optimisation de contenu.

Les résultats fournit par les SERP sont en effet une mine d’informations à exploiter. Dès lors, nous avons développé un crawler capable d’extraire le contenu textuel des pages des sites web. Ce n’est pas une mince affaire et nous avons à cette occasion compris les difficultés rencontrées par le moteur lorsqu’il consulte un site afin de l’analyser (mauvais encodage, balises HTML invalides, spam, etc.).

Etape n°1 - L'analyse sémantique

Prenons l’exemple d’un site souhaitant optimiser son contenu sur le mot-clé « comparateur d’assurance ». Etape n°1, nous lançons l'analyse sur le mot clé directement dans SEOQuantum via la barre de recherche :

Analyse sémantique

L'analyse est lancée, elle prend généralement moins d'une minute.

Etape n°2 - Etude du wordprint

Nous avons inventé un concept sémantique appelé le WordPrint. Les Wordprints sont des notions sémantiques SEO propres à chacun de vos mots-clés : c'est "l'ADN" unique de votre mot clé. Il correspond aux "attentes" de Google en termes de champs lexicaux.

Le WordPrint consiste en une liste de termes identifiés pour la requête « comparateur assurance », avec les deux colonnes suivantes :

  • Puissance : nombre de fois où la lexie (le terme) a été trouvée dans notre analyse, il s’agit de la fréquence (aspect quantitatif).
  • Indice : L'indice est basé sur le modèle BM25, une version évoluée du TF*IDF. Les lexies incontournables sont signalées en surbrillance (fond orange). Ces lexies ont été identifiées comme omniprésentes dans l'analyse. A retenir : plus la valeur BM25 est élevée, plus la lexie est importante même si sa fréquence est faible.

wordprint comparateur assurance

L'idée est alors de demander aux rédacteurs d’utiliser les lexies proposées dans le tableau dans leur rédaction de contenu. Les lexies surlignées en ORANGE sont très importantes (voire indispensables). Elles apparaissent sur la plupart des résultats (même à faible fréquence).

En conclusion

L'inconvénient est qu'avec cette technique de fréquence des lexies, on peut très vite se retrouver à suroptimiser les pages avec un ensemble de mots. Veillez à ce que votre rédacteur ne dérive pas sur du keyword stuffing (bourrage de mots-clés, technique répréhensible d'optimisation par le moteurs de recherche) et que le contenu soit agréable à lire par l'internaute. 
Nous verrons dans un prochain tutorial  la notion deep learning sémantique, nous permettant d'aller encore plus loin dans l'optimisation du contenu.

Et vous ? 

Et vous, quel est votre retour d'expérience sur l'optimisation des contenus ? Laissez un commentaire pour partager vos recommandations !