Focus lettre

Design Arena, terrain de jeu pour comparer les modèles d’IA

Focus de la lettre 17

À chaque semaine de nouveaux modèles publiés par de grands acteurs de l’IA générative, et cette semaine c’est au tour de Google avec Gemini TTS, Mistral avec Mistral OCR 3 et Alibaba avec Wan 2.6.

Vous arrivez à suivre ? On peut avoir du mal tant les versions s’enchaînent ! Et c’est justement cette semaine que j’ai découvert Design Arena qui pourrait être d’une grande utilité pour s’y retrouver.

Comme d’autres applications de classement déjà vues sur le site comme Chatbot Arena ou l’inévitable Compar:IA pour les IA génératives de texte, Design Arena me semble intéressant sur plusieurs points :

  • pouvoir, à la publication de nouveaux modèles, situer leurs performances parmi les modèles existants selon les retours d’utilisateurs – certes subjectfs mais très nombreux -, autant sur des tâches multiples que spécifiques,
  • en découvrir de nouveaux grâce aux ‘“tournois” à l’aveugle… tout en se rendant souvent compte que le modèle habituellement utilisé pour telle ou telle tâche n’est pas forcément le plus performant,
  • s’inspirer des tests des autres utilisateurs en naviguant dans une catégorie donnée,
  • enfin, tester et utiliser gratuitement des modèles seulement accessibles sur abonnement.