Chez Google, les algorithmes se suivent et ne se ressemblent pas. Ils ont néanmoins un point commun : ils donnent des sueurs froides aux experts du référencement naturel, inquiets de voir leurs pratiques chamboulées. Il n’est donc pas surprenant que la nouvelle mise à jour de l’algorithme, Google MUM, soit sur toutes les lèvres SEO depuis son annonce au printemps 2021. Pensé pour être le successeur de BERT, ce nouvel outil déploie des fonctionnalités poussées, basées sur l’intelligence artificielle et une compréhension accrue du langage naturel, pour guider les utilisateurs vers les réponses les plus pertinentes à des requêtes complexes. De quoi s’agit-il exactement ? Comment fonctionne Google MUM ? Et quel sera l’impact de cette mise à jour sur le SEO ?
Qu’est-ce que Google MUM ?
Savez-vous ce qu’est le « Multitask Unified Model » (en français : « modèle unifié multitâche ») ? Non, ce n’est pas une nouvelle théorie physique décrivant notre Univers. C’est le sens de l’acronyme « MUM », du nom de la dernière mise à jour de l’algorithme de Google, dont le déploiement devrait avoir lieu dans les mois (ou les années ?) à venir.
Successeur de BERT, Google MUM est lui aussi basé sur une intelligence artificielle ultra-performante. Et comme BERT, MUM a pour but d’apporter aux internautes des réponses concrètes et précises à des requêtes longues et complexes.
Des requêtes toujours plus complexes sur Google
Les ingénieurs de Mountain View sont partis d’un constat : lorsqu’un utilisateur effectue une recherche complexe (composée de plusieurs propositions et/ou de termes comparatifs, par exemple), il lui faut en moyenne huit requêtes différentes pour trouver la réponse qui correspond à son intention première. Ces huit requêtes sont autant d’étapes indispensables pour préciser la recherche et obtenir des informations qui ne sont pas remontées avec les résultats précédents.
De fait, les requêtes formulées sur Google sont de plus en plus complexes – et complètes. Cette évolution est due en partie à la recherche vocale, qui gagne du terrain, et qui pousse les internautes à formuler des questions en langage naturel. En moyenne, 60 % des utilisateurs emploient la recherche vocale au moins une fois par jour (59 % des 18-24 ans, 65 % des 25-49 ans et 57 % des plus de 50 ans, selon une enquête de PwC). BERT en son temps, et Google MUM dans un avenir proche, tâchent de se conformer à cette nouvelle manière de rechercher l’information.
Qu’est-ce qu’une requête complexe ?
Une requête peut être considérée comme « complexe » pour diverses raisons. Toutefois, trois paramètres sortent du lot :
- La longueur (69,7 % des requêtes tapées sur les moteurs de recherche contiennent au moins quatre mots, selon Ahrefs).
- L’inclusion de plusieurs propositions (« j’ai fait ceci, comment faire cela ? »).
- L’impossibilité – à ce jour – d’y répondre en une seule fois.
L’exemple donné lors de la présentation de Google MUM par le vice-président de la recherche, Pandu Nayak, était le suivant :
« J’ai parcouru le mont Adams. Maintenant, je veux faire de la randonnée sur le mont Fuji l’automne prochain, et je veux savoir quoi faire différemment pour me préparer. »
Une requête pour laquelle, en effet, il semble difficile d’imaginer une page parfaitement optimisée. La tâche attribuée à Google MUM consiste donc à prendre en compte la complexité de la demande et à y apporter des réponses qui s’approchent au maximum de l’intention initiale de l’internaute.
Pour mieux illustrer ce principe, prenons un autre exemple. Imaginons : vous avez pour but de visiter toutes les capitales d’Europe et vous préparez votre prochain voyage. Une requête simple serait : « Quelle capitale visiter en Europe ? ». Google vous fournirait une grande quantité de résultats, en particulier des pages décrivant plusieurs possibilités de villes à découvrir, et ce serait à vous de chercher les informations, puis de formuler des requêtes de plus en plus précises.
Mais voilà : vous avez déjà visité pas mal de capitales européennes et vous souhaitez cibler votre recherche en excluant celles que vous connaissez déjà. Aujourd’hui, la seule façon de faire serait de chercher capitale par capitale, et de voir lesquelles collent à vos envies. Ce que permettra de faire Google MUM, c’est de condenser tous ces besoins en une seule requête complète, du type :
« J’ai aimé Paris et Prague, mais pas Berlin. Quelle capitale va correspondre à mes goûts ? »
Exactement comme si vous discutiez avec le représentant d’une agence de voyage et qu’il vous fournissait une réponse claire… en une seule fois.
Google et la compréhension poussée des intentions de recherche
La compréhension d’une requête, même complexe, est une chose. Mais ce qui compte réellement, c’est de comprendre ce que veut dire l’internaute au moment où il la formule, à savoir : son intention, afin d’apporter la réponse la plus pertinente possible. Et c’est ce que s’attache à faire Google avec ses dernières mises à jour en date, notamment BERT en 2019, et MUM désormais.
L’algorithme BERT (pour « Bidirectional Encoder Representations from Transformers ») s’appuie déjà sur le machine learning pour mieux saisir le contexte dans lequel est formulée une requête, en tâchant de comprendre le sens des termes utilisés en fonction de leur position dans un groupe de mots. Par exemple, si je tape « Apple » en anglais, je peux vouloir trouver des informations nutritionnelles sur la pomme ou dénicher des renseignements au sujet de la marque d’informatique et de téléphonie. L’algorithme utilise donc les termes qui entourent le mot problématique pour en déduire la bonne intention.
Google MUM repose lui aussi sur une architecture Transformer, mais en allant beaucoup plus loin. Mille fois plus puissant que BERT (selon Pandu Nayak), Google MUM ambitionne de comprendre comment les êtres humains communiquent pour mieux interpréter les résultats et servir des réponses adéquates.
La méthode employée ici, le framework T5 (« Text-To-Text Transfer Transformer »), rassemble les enseignements et les améliorations issus des modèles de traitement automatique du langage (« Natural Language Processing ») basés sur l’apprentissage par transfert. En substance, les tâches sont, pour la plupart, formulées dans un format qui utilise des textes comme entrées et comme sorties.
Le diagramme ci-dessus donne une idée du fonctionnement du T5. On voit que chaque tâche considérée prend la forme d’une entrée textuelle. Le modèle est pré-entraîné à générer un texte cible (de « sortie ») à partir du texte initial (d’ « entrée »). Ces tâches incluent la traduction (en vert), l’acceptabilité linguistique (en rouge), la similarité textuelle (en jaune) et la synthèse de l’information (en bleu). Si le sujet vous passionne (et ne vous fait pas peur), voici une ressource produite par Google au sujet de l’apprentissage par transfert avec T5.
En somme, Google MUM est une extension de BERT dont il reprend les mécanismes de machine learning en les poussant plus loin. Cette amélioration découle de trois nouvelles compétences : MUM est multimodal, multilingue et multitâche.
Google MUM : un algorithme multimodal
Ce qu’il faut entendre par « multimodal », c’est que Google MUM est capable de comprendre et d’extraire des informations de plusieurs types de contenus en simultané. Si la version testée actuellement se focalise sur les textes et les images, MUM devrait pouvoir traiter de la même manière des formats vidéo et audio dans les années à venir.
Deux conséquences :
- L’algorithme est en mesure de fournir des résultats issus de son analyse conjointe de plusieurs formats.
- L’internaute peut formuler une requête utilisant différents types de contenus.
Prenons Google Lens à titre d’exemple. Cette application mobile permet d’ores et déjà de générer une recherche à partir d’une image, qu’il s’agisse d’une photo prise avec l’appareil du téléphone ou d’un visuel tiré de la galerie média de l’utilisateur. La promesse de Google MUM, c’est de pouvoir ajouter une requête textuelle ou vocale à cette image, et de demander à l’algorithme de faire une recherche combinée. Par exemple, il serait possible de prendre la photo d’une assiette et d’interroger Google sur la possibilité de la mettre au four à micro-ondes sans danger.
Google MUM : un algorithme multilingue
À ce jour, les réponses apportées à une requête sont extraites des pages rédigées dans la langue employée pour la formuler (sauf si l’expression a du sens dans plusieurs idiomes) ou dans la langue ciblée dans les paramètres.
Google MUM se propose de conduire les internautes vers des sources de qualité dans n’importe laquelle des 75 langues qu’il maîtrise. Concrètement, l’algorithme est capable d’interpréter des résultats à partir de ressources produites dans des langues différentes, voire de générer lui-même des contenus en traduisant instantanément des ressources dans la langue favorite de l’utilisateur.
Le but ? Faire tomber les barrières linguistiques quand il s’agit de présenter les résultats de recherche les plus pertinents. Pour reprendre notre exemple de requête concernant les capitales européennes, Google pourra afficher des informations issues de pages rédigées dans la langue de chaque pays ciblé, via une traduction instantanée. De quoi découvrir des résultats extrêmement complets, que l’on n’aurait pas pu obtenir autrement qu’en consultant les pages dans la langue en question.
Google MUM : un algorithme multitâche
Enfin, Google MUM sait traiter plusieurs tâches en simultané. Certes, ce n’est pas nouveau, car le Google d’aujourd’hui est capable de prendre en compte plusieurs paramètres pour afficher des résultats pertinents, comme la langue employée, le format du contenu, la localisation de l’internaute ou son historique des recherches.
Là encore, MUM ambitionne d’aller plus loin en effectuant plus de tâches en même temps : regroupement des mots-clés, analyse multilingue, interprétation des résultats dans les différents formats de contenu, traduction instantanée, etc. Un processus qui permet à l’algorithme de travailler plus vite et de réduire les délais d’attente des internautes, tout en proposant des résultats plus complets et plus proches des intentions de recherche.
Comment Google MUM va-t-il impacter la pratique du SEO ?
Google MUM est actuellement en phase de test et aucune date de déploiement n’a été avancée. L’impact de ce nouvel algorithme de Google sur la pratique du référencement naturel est donc conjectural. Toutefois, au vu des informations dont nous disposons pour le moment et de l’historique des mises à jour de l’algorithme, il est possible de proposer quelques pistes.
Mettre en avant les résultats les plus pertinents… et pas forcément les mieux optimisés !
Au regard des évolutions constatées ces dernières années, il apparaît clairement que Google vise à corriger la façon dont les internautes accèdent aux résultats.
Le fait est que les internautes ont tendance à se focaliser sur les premiers résultats de la SERP, censés être les plus pertinents : s’ils s’affichent au-dessus des autres, ne sont-ils pas meilleurs ? Or ce n’est pas forcément vrai : les pages les mieux positionnées sont avant tout celles qui ont été optimisées avec le plus d’efficacité. De sorte que des ressources de qualité peuvent être reléguées dans les abîmes de la SERP faute d’une optimisation suffisante, ou en raison d’un manque d’autorité. Imaginez que la réponse la plus pertinente à votre question se trouve en page 27 de Google : vous ne la trouveriez jamais !
De plus en plus, Google cherche donc à mettre en avant les résultats en fonction de leur pertinence par rapport à la question posée, et non plus seulement pour les récompenser de leur bonne optimisation.
Google MUM semble aller dans la même direction. La prise en compte d’un plus grand nombre de paramètres en simultané, la compréhension de plusieurs formats de contenu, et la capacité de l’outil à aller chercher des informations dans la plupart des langues, sont autant de leviers qui vont contribuer à mettre en avant des pages plus pertinentes pour l’internaute. Et pourquoi pas l’encourager à aller chercher des résultats au-delà des premières pages, notamment grâce à Google Lens (c’est aussi l’ambition du « scroll infini » mis en place sur l’application mobile de Google).
Travailler le SEO pour satisfaire les utilisateurs
Pour cette raison, le déploiement de Google MUM ne devrait pas changer fondamentalement la donne pour ceux qui pratiquent déjà un SEO « user centric ». Une bonne façon d’absorber ce nouvel algorithme consiste ainsi à poursuivre les efforts en matière de…
- qualité du contenu (en application des critères EAT : Expertise, Authority, Trust) ;
- pertinence du contenu (de manière à ce qu’il réponde avec plus de précision à l’intention de l’internaute, par exemple en travaillant le champ sémantique) ;
- optimisation de la recherche vocale (qui emploie le langage naturel pour des requêtes plus longues, plus précises, et formulées comme des questions) ;
- amélioration de l’expérience utilisateur (en tenant compte des trois nouveaux critères de Google : les Core Web Vitals) ;
- optimisation des images, des vidéos et des fichiers audio (Google MUM ayant toutes les chances de valoriser les contenus visuels et audio, il est important de les optimiser au mieux).
En somme, avec l’approche multimodale de Google MUM, ce sont tous les éléments de la page qui seront pris en compte, demain, pour afficher des résultats pertinents aux internautes – et tâcher d’obtenir leur satisfaction.
Google MUM n’est pas encore là. Mais cela ne doit pas vous empêcher de vous y préparer !