Un jour, un outil d'IA générative

MAI Playground (https://playground.microsoft.ai/) donne accès aux modèles IA de Microsoft : génération d’images, transcription audio, synthèse vocale et conversation multimodale.

4 modèles ont disponibles :

  • MAI-Image-2.5 génère et modifie des images depuis une instruction textuelle ou une image source (ne fonctionnait pas pendan les tests). Unne version Flash est accessible.
  • MAI-Transcribe-1.5 convertit en texte un fichier audio importé ou enregistré, 25 langues.
  • MAI-Voice-2 synthétise du texte en audio avec 45 voix, 19 langues et 8 styles.
  • DuoAI est une expérimentation combinant transcription et synthèse vocale : l’utilisateur interagit en temps réel avec deux personnages vocaux, Luna et Leo.
    Deux modes : conversation libre et construction d’histoire interactive pas à pas.Ne fonctionne qu’en anglais mais comprend le français.

Un modèle de langage avec raisonnement est annoncé, MAI-Thinking-1, il fera l’objet d’un nouvel article.

Accès gratuit et semble illimité.