Un jour, un outil d'IA générative

Focus

La recherche après la recherche ?

Focus de la lettre 39

Ecosia n’est pas un outil nouveau, il existe depuis 2009. C’est un moteur de recherche à but non lucratif, basé sur Bing et Google, dont les revenus publicitaires financent des projets de reforestation et d’énergie renouvelable dans le monde. Beaucoup en ont déjà entendu parler, certains l’utilisent depuis des années. Ce qui a changé récemment, c’est qu’Ecosia a intégré deux fonctionnalités IA : les “Overviews” en haut des résultats de recherche et un Chat IA en mode conversationnel.

J’ai passé une partie de la semaine à faire des recherches depuis Ecosia pour observer ces deux fonctionnalités. Mon premier réflexe a été de vérifier la qualité des résultats et des sources et de voir si leur pertinence était comparable à ce qu’on obtient ailleurs, vu qu’Ecosia agrège Bing et Google. Les résultats m’ont semblé très probants. Mais ce qui m’a davantage occupé, c’est la façon dont l’IA s’insère dans l’expérience.

Les Overviews s’affichent en haut des résultats sous forme de synthèses avec des liens vers les sources. La première chose que j’ai notée, c’est qu’elles sont activées par défaut mais désactivables dans les paramètres. C’est une décision de design plus rare qu’il n’y paraît : la plupart des moteurs qui ont intégré des synthèses IA ne proposent pas cette option, ou la rendent difficile à trouver. Ici, c’est dans les paramètres, accessible et assumé. On peut vouloir chercher sans synthèse et c’est prévu.

Ce que propose Ecosia, Google le propose dans 200 pays mais pas encore en France, le groupe a indiqué que les “AI Overviews” n’ont pas été lancées en France à cause d’”incertitudes juridiques”, sans plus de précision. Aucune date de déploiement n’a été confirmée, ni même si les AI Overviews y seraient différentes. Ces incertitudes pourraient être liées aux droits voisins : depuis 2019, la France a transposé la directive européenne sur le droit d’auteur de façon stricte, avec des protections renforcées pour les éditeurs de presse sur la réutilisation de leurs contenus. Ecosia, en s’appuyant sur Mistral Small et une infrastructure européenne, pourrait se trouver dans un régime différent et proposer ses overviews là où Google n’y serait pas encore prêt ?

Ce qui se joue derrière la question des overviews, c’est aussi celle du trafic. Dans les pays où Google les a déployées, les baisses de taux de clic observées vont de 20 à 40% en moyenne pour les requêtes touchées, et au-delà de 60% pour les requêtes très informatives comme le détaille Thomas Skowronski dans une chronique publiée sur Minted à retrouver dans les lectures partagées : l’utilisateur obtient sa réponse dans la page de résultats, sans cliquer sur aucun lien. L’étude de la Revue des médias / INA partagée en Lettre 37 le montrait depuis un angle proche : les chatbots redistribuent le trafic vers les médias selon leurs propres logiques éditoriales, loin d’être neutres. Si les synthèses se substituent aux clics, la surface visible des sources se réduit encore, en plus du filtrage déjà opéré par les algorithmes de classement. Avant les overviews, la première page affichait beaucoup de liens. Avec une synthèse, seules trois à cinq sources sont mises en avant. La question n’est pas nouvelle, mais elle change d’échelle.

Le Chat IA, lui, fonctionne comme un assistant de recherche conversationnel : on pose une question en langage naturel, il cherche sur le web, on affine, on relance, on peut ajouter des documents. Là aussi quelque chose de plus large se passe. Depuis que les moteurs de recherche existent, c’est nous qui avons appris à parler leur langue : le mot-clé, les guillemets pour forcer une expression exacte, le plus ou le tiret du “moins quelque chose” pour intégrer ou exclure un terme. On a adapté notre façon de formuler à ce que la machine pouvait traiter. Avec le Chat IA intégré dans le moteur de recherche comme dans Ecosia, cette adaptation s’inverse : on peut formuler comme on pense et c’est le modèle qui fait le travail vers les sources. Je pense que ce n’est pas anodin : on ne cherche plus de la même façon, et on ne réfléchit peut-être plus tout à fait pareil à ce qu’on cherche quand on n’est plus contraint par le format du mot-clé. Il me semble que le mot clé oblige plus à la synthèse et à la reformulation.

Une partie de ce que l’on perd me paraît plus difficile à discerner. On perd déjà la page elle-même : son design, son angle éditorial, sa façon propre de mettre en scène un sujet… et même quelque part la pensée de ses auteurs ou porteurs… Aura-t-on finalement encore besoin de pages web si la tendance se poursuit ou simplement de bases de données ? Un retour à l’affichage de textes html devriendrait finalement suffisant pour alimenter les réponses IA ?

On perd aussi la sérendipité, ce moment où on tombe sur quelque chose qu’on ne cherchait pas, qui a surgi dans la liste constituée par l’algorithme, ce sujet dont on ignorait jusqu’à son existence. Le chatbot répond à ce qu’on lui demande. Il ne montre pas ce qu’on n’avait pas prévu de chercher.

En dehors des deux fonctionnalités IA, ce que je retient aussi d’Ecosia, c’est la cohérence de la démarche éthique. Elle a été intégrée dans les choix techniques : modèle, hébergement, paramètres par défaut, politique de données. La plupart du temps, ces choix sont invisibles pour l’utilisateur, enfouis dans des pages de documentation que personne ne lit. Ici, ils sont mis en avant et explicitement revendiqués.

Les deux fonctionnalités IA reposent sur Mistral Small hébergé sur une infrastructure européenne. Mistral est un modèle européen, français, et choisir d’y adosser ses fonctionnalités IA quand on est un moteur de recherche dont la mission est explicitement éthique, fait partie de la cohérence globale. Le choix de Mistral Small et non d’un modèle plus lourd, c’est aussi un choix de sobriété, cohérent avec une démarche qui revendique la frugalité.

Ce ne sont pas des engagements spectaculaires, mais ce sont des engagements précis et qui ont du sens.

La vraie question qui est posée finalement n’est pas “Ecosia est-il meilleur que Google ?”, il en utilise de toute façon une partie de l’architecture de recherche, mais plutôt une question peut-être un peu plus gênante pour nous : quand on choisit un outil, est-ce qu’on choisit aussi vraiment ses valeurs ? Et quand ce même outil nous libère du mot-clé pour nous laisser parler normalement, est-ce qu’on remarque seulement que quelque chose a changé dans notre façon de chercher et dans ce qu’on ne cherche peut-être plus ?

En écho

→ Lettre 36, Que reste-t-il quand l’outil a fait le travail ?

→ Lettre 34, Une information vraisemblable ?