Pourquoi ne pas écrire (uniquement) pour les humains ?

Anthony SEOQuantum

Après une semaine de congés, je reviens sur le concept de Word embedding que nous avons touché du doigt dans le guide n°2 : Comment fonctionne RankBrain et l'optimisation des contenus ?

Nous allons voir qu'il est possible d'aller encore plus loin avec ce type d'approche utilisé par Google. Rappelez-vous le moteur de recherche cherche à répondre aux besoins de l'internaute, mais sait-il le faire efficacement ? Si non, comment l'aider ?

Petit rappel du guide n°2 

Au sein d’un corpus, un mot n’est pas utilisé de n’importe quelle manière, il est contextualisé : en relation avec les autres mots. L'approche par le Word Embedding permet de représenter un mot par un vecteur en fonction de sa position dans le corpus.

Les méthodes de Word Embedding construisent, pour chaque mot, une fenêtre de contexte. Nous utilisons des vecteurs de contexte afin de représenter chaque mot à travers une matrice. C’est une notion importante chez Google, notamment depuis l’arrivée de RankBrain.

 

Identifier l’intention de l’internaute

Une question essentielle à se poser avant de rédiger un contenu est d’identifier l’intention de l’internaute cachée derrière le mot clé. Plus vous serez en adéquation avec l’intention, plus vous rankerez facilement (n’oubliez pas que Google souhaite répondre aux besoins de l’internaute). Nous verrons dans un prochain sujet les différentes typologies de contenu que nous pouvons trouver, à savoir : navigationnelle, informationnelle, commerciale et enfin transactionnelle.

Ce qui est fascinant avec le deep learning, c'est que l'on peut "percevoir" l'intention derrière le mot. C’est une méthode très utile pour donner un "sens" aux rédacteurs.

Grâce au Deep Learning, SEOQuantum permet de comprendre et normaliser ce que désire l'utilisateur.

Vous retrouvez ce tableau en dessous de l'analyse du Wordprint sur l'outil SEOQuantum.

Ici, pour « jeux d’extérieur » l’internaute souhaite trouver des idées de jeux (chasse aux trésors, jeux de ballons,…) et non pas des structures de jeux d’extérieurs (tobbogan, balançoire…). Le coefficient de similitude (de 0 à 1) est le rapprochement entre la requête et l’intention de l’utilisateur.

Contextualiser vos contenus

Pour connaitre l’affiliation d’une lexie (son contexte), il suffit de cliquer sur les 3 barres horizontales dans SEOQuantum.

Google sait qu'il existe une « fenêtre logique » d'utilisation des lexies dans un corpus. Reprenons notre exemple sur l’analyse de « comparateur d’assurance » du premier guide. 

Pour le mot "garantie", dans le contexte, Google prédit une forte probabilité de trouver "tiers", "responsabilité civile", "dommage" dans la fenêtre de contexte. Si ces termes ne sont pas utilisés de la sorte, la note sémantique de la page baisse.

Avant d'aller plus loin, il est important d'intégrer le principe de contextualisation dans vos contenus. Aujourd'hui, il ne suffit plus d'utiliser une "liste de mots" à inclure dans la rédaction, ces lexies sont à utiliser en corrélation avec d'autres pour maximiser la performance sémantique des textes.

Clusteriser les champs lexicaux

Google est un monstre assoiffé de données. Nous nous sommes très vite demandé comment utiliser le « deep learning sémantique » pour être toujours plus pertinent. Chez SEOQuantum, une idée folle nait dans nos esprits : la clusterisation des champs lexicaux par l’intention de l’utilisateur. La clusterisation consiste à regrouper des informations entre elles pour en définir des typologies de groupes.

Cette méthode est très approche du concept du "cocon sémantique" qui cherche à répondre à l’attente de l’internaute par la création de contenu.

En voici l’approche sur notre exemple "comparateur d'assurance" du premier guide :

Cluster sémantique

 

Cet arbre a deux fonctions. La première est une aide rédactionnelle décisionnelle, qui permet de lier une lexie à son environnement. Par exemple, dans quel cas dois-je utiliser le terme « responsabilité civile » ? Ici, le mot est lié à « tiers », lui-même lié à « véhicule ». Il s’agit donc plutôt d’assurance de véhicule.

La seconde fonction de l’arbre est le regroupement des intentions utilisateurs.
Nous pouvons regrouper les différentes branches par intention :

  • en rose à assurance prêt ;
  • en orange à assurance vie ;
  • en vert à assurance véhicule

Lorsque vous avez une page optimisée pour un certain mot-clé et que la compétition sur celui-ci est très importante, il est recommandé d’utiliser des pages à contenus proches afin de « pousser » et soutenir la page principale, il s’agit de l’un des principes du cocon sémantique.

Pour ce faire, SEOQuantum peut réunir les champs lexicaux par grandes attentes des utilisateurs. Les clusters sont représentés sous forme de tableaux regroupant les lexies à utiliser.

Astuce : Si la requête est très concurrentielle, nous créons une page par cluster, si elle l’est moins, nous créons un paragraphe par cluster

Reprenons notre cas de « comparateur d’assurance », il s'agit d'une requête concurrentielle,  nous déployons donc une page principale et trois pages enfants qui viendront la "soutenir" :

Comparateur assurance

Une page sur "l'assurance véhicule" (cluster n°9) : 

Une page sur "les garanties des assurances" (cluster n°2) : 


Une page sur "les conducteurs" (cluster n°3) : 


Choisissez vos clusters en fonction de l'affinité que vous avez (ou que vos clients) a pour chacun d'entre eux.

En conclusion

Pourquoi ne pas écrire (uniquement) pour les humains ?

Si Google comprend de mieux en mieux les recherches sur le language naturelle et devient plus "intelligent" : pourquoi ne pas simplement écrire du contenu pour les humains et oublier tout ce procédé ? C'est une question ligitime. 

Depuis 2000, Google a parcouru un long chemin dans sa démarche de compréhension des contenus. Mais soyons honnête en 2017, nous sommes encore très loin de la compréhension parfaite du langage humain. Pour rendre le référencement naturel et la création de contenu le plus efficace possible, vous devez comprendre comment la machine Google pense et notamment le procédé de Word Embedding. SEOQuantum intègre cette technologie, l'outil vous aide à optimiser la rédaction de vos contenus en se rapprochant au plus près des attentes du moteur de recherche.