Focus lettre

Handy, la reconnaissance vocale open source née d’un doigt cassé

Focus de la lettre 9

Le focus de la semaine sera consacré à Handy, bien sûr pour sa facilité d’utilisation, par son installation et son fonctionnement local et surtout ses résultats plus que satisfaisants avec les modèles proposés.

Ce choix d’Handy est aussi pour son histoire : son auteur, développeur, après s’être cassé le doigt, cherche l’outil de reconnaissance vocale qui lui conviendra. Entre coûts élevés, données stockées ou performances moindres, il décide de le développer lui-même à partir des modèles “speech to text” open source partagés. Il y parvient avec un outil simple et efficace sur tous les systèmes qu’il décide de rendre 100% open source, entièrement partageable et modifiable pour d’autres évolutions .

Derrière cette belle histoire, il y a les partages de technologies open source – ouverts totalement comme ici ou semi-ouverts pour beaucoup de modèles de langage – qui sont souvent à la base ou simplement utilisés dans de nombreux outils d’IA génératives, souvent effacés par les grandes annonces des nouveaux modèles “révolutionnaires” (au moins pour une semaine ou deux…) et des grands éditeurs.

Il y a surtout la démonstration que la volonté de partager et le partage effectif sont un modèle possible, grâce à des partages précédents et des appropriations futures qui permettront d’autres applications.