Google a lancé le nouvel algorithme BERT

Google a annoncé le 25/10/19 le lancement d’un nouvel algorithme baptisé BERT pour Bidirectional Encoder Representations from Transformers. Il s’agit d’une évolution majeure depuis le déploiement de Rank Brain début 2015. Les deux s’appuient sur des réseaux de neurones. BERT procède d’une analyse du langage naturel. Il devrait impacter environ 10% des requêtes sur le moteur de recherche. Il a pour ambition de préciser le contexte d’une question, d’analyser les relations des mots les uns avec les autres… Explications et conséquences.

BERT comprend le sens d’une question au-delà des seuls mots clés

Le déploiement progressif de BERT (Bidirectional Encoder Representations from Transformers), confirmé le 25/10/19 par Google, s’inscrit dans la continuité d’un article scientifique, publié en 2018, dont le premier auteur est Jacob Devlin, ex-Microsoft, spécialiste du traitement du langage et deep learning.

 Lire l’article original – BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding

A l’heure où le moteur de recherche est devenu moteur de question ; alors que les assistants vocaux deviennent aussi des objets du quotidien, l’objectif de BERT est de permettre la meilleure compréhension possible d’une requête souvent formulée de façon spontanée, c’est à dire s’appuyant sur le langage naturel et oral de l’utilisateur ; cela pour être en mesure de l’interpréter au plus près, en vue de renvoyer les résultats les plus pertinents, notamment dans les fameux extraits enrichis, les Rich Snippets en VO, conséquence de la mise en œuvre du Knowledge Graph.

Selon GoogleBERT devrait concerner 10% des recherches et il n’y a pas d’optimisation SEO, l’acronyme anglais de Search Engine Optimization pour optimisation du référencement naturel en VF, à envisager pour séduire l’algorithme. La compréhension du fonctionnement de celui-ci est néanmoins intéressante et à intégrer avant d’envisager la rédaction puis la publication de contenus sur un site web.

A la différence d’une requête simple par mots clés, une conception déjà datée du SEO, avec un traitement des occurrences dans l’ordre de lecture et des résultats ensuite remontés dans le même ordre (mot 1 > résultat 1 puis mot 2 > résultat 2, etc…), BERT envisage le rapport des mots les uns par rapport aux autres. Il considère la question dans son ensemble en la contextualisant.

Google BERT algorithm exemple SEO
source Google

Dans l’exemple ci-dessus, on comprend mieux le sens de BERT et son interprétation de la question posée :

Do Estheticians stand a lot at work ?

Traduit en langue française, cela donne, les esthéticiennes sont-elles souvent debout au travail ? Le mot stand peut renvoyer dans un premier temps à autonome… et adresser une réponse (à gauche dans l’illustration fournie par Google) en lien avec les spécificités du métier d’estéhéticienne, selon les secteurs, ici entre médical et spa.

Les modèles d’analyse du langage naturel de BERT, soutenus par l’apprentissage ou Machine Learning, vont un cran plus loin. Ils interprètent stand comme étant en lien avec les contraintes physiques d’exercice de la profession d’esthéticienne et renvoient en retour (à droite dans l’illustration) une réponse jugée plus utile.

• Voir les autres exemples dans l’article d’annonce de BERT sur le blog officiel Google

BERT en faveur de contenus originaux, à valeur ajoutée et en phase avec les intentions de l’utilisateur

« La compréhension de la langue reste un défi »écrit Pandu Nayak, vice-Président de Google… ce qui est réjouissant et stimulant. L’intelligence humaine a de beaux jours devant elle car les algorithmes les plus puissants ne sont pas encore en mesure de saisir toutes les nuances d’un propos soumis à un moteur de recherche.

Ces évolutions confirment néanmoins qu’une approche du référencement naturel, fondée sur les seuls mots clés et les volumes de requête correspondant, renvoyés par des outils SEO du marché comme Semrush ou Ranxplorer, sera limitante car ne fournissant qu’une brique. Surtout en B2B (Business to Business) où il convient, à la différence du B2C (Business to Consumer), d’aller très au-delà de la fiche article… pour aligner la stratégie web éditoriale avec les stratégies commerciale, marketing et communication jusqu’à déployer une marque média globale, rayonnant et interagissant avec l’ensemble des parties prenantes de l’organisation émettrice via les réseaux sociaux. Il s’agit tout autant de « vendre » une promesse, une offre de valeur… qu’un produit en capitalisant, avec un dosage subtil, sur un mélange entre marketing de contenus ou content marketing et marketing de l’offre ou inbound marketing. 

A l’instar d’une approche design centrée utilisateur, le paradigme du SEO s’est inversé ! De montant, c’est à dire émetteur vers récepteur, en simple correspondance de mots clés… il est devenu descendant : ce qui prime, c’est la question posée par l’internaute, et la capacité d’un contenu au sein d’une page web à fournir la réponse la plus adaptée car précise. Cette vision contemporaine du référencement naturel s’envisage en double pyramide inversée comme le détaille Peter J. Meyers sur le blog Moz dans How to Write Content for Answers Using the Inverted Pyramid (illustration ci-dessous).

SEO Ouest MEDIAS rich snippet BERT algorithm inverted pyramid BERT
source MOZ

A l’instar de BERT, contextualiser la stratégie SEO pour une vision d’ensemble !

Des contenus originaux, à forte valeur ajoutée, en phase avec le besoin, ainsi envisagés dans une logique EAT (Expertise, Autorité et Confiance) puis publiés sur une plateforme web conforme aux derniers standards techniques… la trame d’un SEO moderne est posée entre :

  • SEO technique : compatibilité mobile ou caractère 100% responsif, vitesse de chargement par frugalité des ressources (Java, CSS, poids des images), balisage Hn, métadonnées, URL structurées, balise alt et SEO des photos…
  • SEO éditorial : passer des mots clés… à la question pour construire la réponse, structuration du texte en pyramide inversée (importance du titre, résumé et 1er paragraphe) et concordance avec le balisage Hn, liens internes, acquisition de liens entrants significatifs pour renforcer le potentiel EAT de la page…
  • SEO sémantique : au sens du web des données et de la capacité à lier entre elles des bases de connaissances dans la logique du Knowledge Graph déployé par Google en 2012 avec un prérequis qui tient au balisage des pages en micro-données sémantiques (schema.org), critère majeur pour postuler aux extraits enrichis… ce qui équivaut à être LA réponse à la question.

Pierre Minier/ Ouest Médias

Les derniers articles du blog