Un jour, un outil d'IA générative

Focus

Et si nous choisissions le niveau d’autonomie de la machine ?

Focus de la lettre 33

En testant Holotab cette semaine, j’ai pensé à Clico dont on avait parlé dans le focus de la lettre 29. Clico, comme d’autres extensions déjà testées, s’installe dans le navigateur et propose un chatbot en surimpression des pages visitées : l’IA générative est là, disponible, c’est nous qui décidons de l’ouvrir, d’en tenir compte ou non. Le frottement reste présent, même s’il reste discret.

Holotab franchit une étape de plus. Ce n’est plus un assistant posté en lisière de la navigation, c’est un agent qui navigue à notre place : on décrit une tâche en quelques mots, à l’écrit ou à voix haute, et l’extension ouvre des onglets, clique, remplit des champs, extrait ce qu’elle trouve. Comet de Perplexity ou d’autres navigateurs le proposent déjà, ici Holotab s’insère dans notre navigateur du quotidien, sans aucune installation ou changement. On peut même enregistrer des routines pour qu’elles soient rejouées sans qu’on ait à redécrire. L’interface disparaît presque.

Holotab propose trois niveaux d’autonomie. En mode supervisé, l’agent demande confirmation avant chaque action. En mode équilibré, il agit sur les tâches courantes et ne s’arrête que pour les actions irréversibles. En mode autonome, il enchaîne sans s’arrêter, sauf face à un login ou un captcha. Ce choix, c’est nous qui devons le faire dans les paramètres. La question du degré de délégation, qu’on effleure rarement parce qu’elle est rarement posée explicitement, est ici mise dans l’interface elle-même.

En choisissant le niveau d’autonomie, on réalise qu’on ne s’est pas forcément posé cette question pour les autres outils. Pour les modèles de langage qu’on utilise au quotidien, pour les extensions déjà installées, pour les automatisations déjà en place. Le niveau d’autonomie est souvent décidé par défaut.

Ce que Holotab rend visible, c’est que déléguer une navigation web et déléguer une décision ne sont pas tout à fait la même chose, mais cela emprunte parfois les mêmes chemins. Enregistrer une routine, c’est confier à la machine un comportement répétitif qu’on maîtrisait et dont on pouvait décider à chaque fois de le modifier légèrement. La routine libère du temps, elle efface aussi la micro-décision.

Il reste une question que trois niveaux d’autonomie ne tranchent pas : jusqu’où laisse-t-on entrer l’agent ? Holotab navigue à notre place, il voit ce que nous voyons : nos boîtes mail, nos espaces de travail, nos comptes, peut-être même d’autres données bien plus sensibles que nous laisserions à voir. Le mode autonome s’arrête aux logins et aux captchas, c’est une limite technique, pas une garantie : si le compte est déjà connecté en amont, pas d’arrêt. Et même si H Company dit bloquer l’utilisation sur certains sites et ne pas conserver les captures d’écrans nécessaires au fonctionnement, elles transitent bien sur des serveurs…

On peut se demander ce qu’on accepte de rendre visible à un agent qu’on ne contrôle plus vraiment en temps réel, ce qu’il traverse sans qu’on y prête attention, ce que ça implique… La délégation d’une tâche de recherche et la délégation d’une navigation dans un espace personnel ne présentent pas le même niveau de risque, même si l’interface est identique. Peut-être faut-il se fixer ses propres limites avant de choisir son niveau d’autonomie, et pas l’inverse.

On retrouve ici le fil du “ah ouais ?” plutôt que du “waouh” dont on parlait dans la lettre 28, et la question posée par Écho dans la lettre 30 : ce n’est pas de savoir si la machine fait bien ce qu’on lui demande, c’est de savoir si on a bien décidé ce qu’on lui demandait. La question que Holotab pose explicitement, peut-être faut-il se forcer à se la poser pour tous les outils qu’on utilise déjà, même si elle n’est écrite nulle part.