Générer vite ou décider lentement ?
Cette semaine, j’ai rapproché deux outils en apparence éloignés.
Drafted génère un plan de maison à partir d’une liste de pièces et d’un style, avec une bibliothèque de plus de 85 000 plans déjà produits, consultables et remixables.
Swishy promet d’aller vite et y parvient. On tape une instruction, on pioche dans une galerie de plus de cent modèles, et la vidéo en motion design sort en quelques secondes, typographie animée, transitions propres et rendu correct. Dans les tests cette semaine, le résultat tient la route.
Dans les deux cas, la promesse est la même : du sur-mesure en apparence, du prêt-à-porter dans la mécanique. On choisit dans un catalogue, on personnalise quelques détails, et le résultat sort en quelques secondes. Mais, comme pour la fast fashion, en l’imaginant entre des centaines de mains différentes, une question se pose vite : qu’est-ce qui distinguera la maison de l’un, la vidéo de l’autre, si tout le monde part du même patron ?
C’est exactement ce que dénonce avec humour Noémie Petit dans une vidéo que j’ai vu passer cette semaine sur Instagram concernant les affiches d’événements générées par IA. Trop d’informations entassées sur une seule image, tous les bars, restaurants, associations, salles de concert, etc. qui finissent par produire la même affiche, au point qu’on ne sait plus qui propose quoi, quand et où. Son coup de gueule touche juste, et il touche pour moi trois points principaux.
D’abord une question de connaissance, celle des codes implicites d’une bonne communication, qu’on n’acquiert pas en formulant un prompt mais en apprenant, en regardant, en ratant et en recommençant.
Ensuite des compétences nécessaires : la communication visuelle nécessite des compétences, c’est même pour ça que c’est un métier… avec ses règles de hiérarchie de l’information, de lisibilité, de ce qu’on garde et de ce qu’on enlève. Un chatbot, si l’instruction ne lui précise pas, ne sait pas qu’une affiche efficace est une affiche qui retire plutôt qu’elle n’ajoute.
Et puis, une fois de plus dans cette lettre, une question de délégation : on confie à la machine non seulement l’exécution mais le choix, et le choix par défaut d’un modèle entraîné sur des millions d’affiches, c’est la moyenne, jamais la singularité. On retrouve d’ailleurs une mécanique proche dans l’étude de l’université du Maryland partagée par Myrtille Gardet sur l’ “effondrement argumentatif” : interrogés séparément sur un même sujet, les modèles de langage convergent vers les mêmes arguments, là où les arguments humains sont pluriels. Ce qui touche les idées, semble aussi bien toucher les supports de communication…
Mais pour moi rien de tout ça ne condamne l’outil. Faire de la communication avec l’IA générative, c’est possible, et ça peut même très bien fonctionner, à condition que ce soit travaillé : itéré, recadré, contredit, retouché à la main jusqu’à ce que le résultat dise quelque chose de précis plutôt que tout en même temps. La différence ne se joue pas entre humain et machine, elle se joue entre une génération acceptée telle quelle et une génération dirigée jusqu’au bout.
Ce qui se perd, quand on saute cette étape, n’est pas une question de qualité technique. Les rendus sont propres, les couleurs sont justes, le texte est lisible. Ce qui se perd, c’est la trace d’une décision. Et une affiche, un visuel, une vidéo de communication, ça n’a jamais été seulement un texte ou des couleurs : c’est d’abord une décision, des choix assumés et artistiques, et qu’on peut reconnaître parmi d’autres.
Et derrière ces décisions, il y a souvent des métiers qu’on a tendance à oublier dans ces contenus générés en deux clics : celui d’illustrateur, de graphiste, de vidéaste, dont c’est précisément le savoir-faire qu’on contourne à chaque fois qu’on laisse la machine choisir à notre place.
En écho
→ Dans la lettre 34, on s’arrêtait sur ce qui ressemble à de l’information locale via la récupération de contenus et qui, à force d’industrialisation, finit par la remplacer.