Le monde dans la poche ?
Cette semaine je rapproche deux applications qui en apparence n’ont en commun que l’open-source. L’une est un modèle de langage multimodal léger, installable sur un téléphone et disponible sans connexion. L’autre surveille le monde en temps réel et est entièrement paramétrable. Deux directions opposées en apparence, la puissance qui se compresse d’un côté et de l’autre le flux qui s’ouvre, et pourtant la même question en creux : que nous apporte cette double échelle ?
Gemma 4 tourne sur un téléphone, pas de serveur, pas d’abonnement : un modèle multimodal, open source, qui s’installe sur son appareil. Il inverse finalement le sens de ce qu’on est désormais habitués à suivre : non pas plus grand, plus puissant ou doté de plus de paramètres, mais plus petit, plus léger et plus autonome.
Ce mouvement de “miniaturisation” n’est pas nouveau, on en a déjà parlé ici avec les petits modèles frugaux de la lettre 21 ou Thaura et Public AI dans la lettre 30.
Ce qui change avec Gemma 4, c’est l’échelle technique atteinte : multimodal, capable de générer du texte ou de la voix et d’analyser des images, rapidement et avec cohérence, dans la poche, sans dépendre d’une infrastructure externe.
La promesse d’un accès pour toutes et tous semble prendre une forme concrète et les usages hors ligne deviennent possibles.
De l’autre côté de ce focus, World Monitor prend le chemin inverse, il ouvre à l’immensité : des flux de données et d’informations géopolitiques, économiques, technologiques, environnementaux en temps réel, sur une seule interface entièrement paramétrable. Open source, installable sur sa propre machine : il n’y a plus d’intermédiaire éditorial entre le monde et nous.
C’est un outil de veille mais pas tout à fait comme les autres : là où un agrégateur classique propose une sélection pré-construite, World Monitor demande de décider soi-même ce qu’on surveille, comment et avec quels filtres. Le paramétrage devient un geste éditorial à part entière : choisir ses sources, ses zones géographiques ou ses seuils d’alerte, c’est déjà une forme de regard sur le monde avant même d’en lire les résultats.
Je trouve ce renversement intéressant : on ne reçoit plus un flux pré-filtré par des éditeurs, on construit le sien. C’est une liberté réelle mais c’est aussi une responsabilité nouvelle, celle de savoir ce qu’on cherche, où, pourquoi, et comment lire ce qui remonte sur ce tableau géant.
Ces deux outils sont “disponibles pour toutes et tous” mais disponibles n’est pas synonyme d’ “accessibles à toutes et tous”. Gemma 4 demande un téléphone récent, suffisamment puissant pour faire tourner un modèle multimodal localement, il nécessite de comprendre le fonctionnement d’une IA générative et de maîtriser les instructions à la machine. World Monitor demande de savoir ce qu’on installe, connaître les sources choisies, comment le configurer, et ensuite de savoir lire des flux bruts sans s’y noyer. Même si l’open source et la gratuité sont des conditions nécessaires, elles ne sont pas suffisantes pour réduire la fracture possible.
Selon moi, la fracture numérique ne disparaît pas avec ces outils mais elle se transforme. Elle se déplace de l’accès technique et financier vers la littératie : comprendre ce qu’est un modèle de langage, ce qu’on paramètre quand on choisit ses sources, quelles instructions on transmet, comment on analyse les résultats. Et ce sont des compétences qui ne s’acquièrent pas en quelques clics…
Le modèle et le monde dans la poche, oui. Mais dans la poche de qui et pour quoi faire concrètement ? C’est peut-être la question la plus importante…
Les deux me semblent bien pointer dans la même direction : non pas rendre l’IA plus impressionnante, mais la rendre plus proche, plus personnalisée et nous rendre plus autonomes. C’est certes une étape essentielle mais la proximité technique ne crée pas la compréhension, et la disponibilité ne garantit pas l’accès.
Et si ce qu’il restait surtout à construire, ce n’était plus la question de la disponibilité des applications, mais ce qui permettra à chacune et chacun de décider si, pourquoi et comment s’en saisir ?