SAM Audio
Sam Audio de Meta (description : https://ai.meta.com/samaudio/ et démonstration : https://aidemos.meta.com/segment-anything) recherche et isole des éléments d’une vidéo ou d’un...
Molmo 2
Molmo 2 (documentation : https://allenai.org/blog/molmo2 / modèles : https://huggingface.co/collections/allenai/molmo2 / démonstration : https://playground.allenai.org/?model=molmo2-8b) est une série de modèles, légers et...
Lucy
Lucy (https://platform.decart.ai/) est un ensemble de modèles de génération images et vidéo de Decart.ai : Export png et mp4. 800...
Flux 2
Flux 2 (https://playground.bfl.ai/) est un ensemble de modèles de Black Forest labs : Flux flex, Flux Pro et Flux dev....
Qwen Image Edit Camera Angle Control
Qwen Image Edit Camera Angle Control (démonstration : https://huggingface.co/spaces/linoyts/Qwen-Image-Edit-Angles et documentation : https://huggingface.co/dx8152/Qwen-Edit-2509-Multiple-angles) génère des vues sous des angles différents...
Kutri
Kutri (documentation : https://huggingface.co/krutrim-ai-labs et chatbot : https://www.kruti.ai/) est le « chatbot de « premier assistant IA d’Inde » produit par Krutrim AI...
Oracles ou romanciers
Oracles ou romanciers (application : https://oraclesouromanciers.streamlit.app/ et documentation : https://github.com/ArthurSrz/oracles_ou_romanciers) est une application qui, selon son auteur Arthur Sarazin, « génère...
Search de Jina.ai
Search de Jina.ai (démonstration : https://search.jina.ai/ et documentation : https://github.com/jina-ai) est un moteur de recherche avec raisonnement basé sur une...
TurboSeek
TurboSeek (https://www.turboseek.io/ et documentation : https://github.com/Nutlope/turboseek) est un moteur de recherche avec IA générative, basé sur Gpt-oss pour la réponse...
Handy
Handy (https://handy.computer/ et documentation https://github.com/cjpais/Handy) est un outil de reconnaissance vocale (Speech to text), disponible sur MacOS, Windows et Linux...
Minimax M2
Minimax M2 (https://agent.minimax.io/ et documentation: https://huggingface.co/MiniMaxAI/MiniMax-M2) est un modèle de langage spécialisé dans les agents avec réflexion et le code...
Folo
Folo (documentation : https://github.com/RSSNext/Folo et application : folo.is) est un agrégateur de contenus (réseaux sociaux, fils rss) augmenté par des...
Matrix Game
Matrix Game (documentation : https://matrix-game-v2.github.io/ et démonstration : https://huggingface.co/spaces/dn6/matrix-game-2) génére une vidéo avec mouvement à partir d’une image fixe et...
Umint
Umint (https://umint-openwebui.hf.space et documentation : https://huggingface.co/umint) pour UltimaX Intelligence est un chatbot regroupant modèles de langage et d’images (GPT, Deepseek, Gemma,...
Qwen 3 Omni
Qwen 3 Omni (documentation : https://github.com/QwenLM/Qwen3-Omni et utilisation sur hugging Face https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe ou Qwen Chat) est un modèle de langage...
Qwen 3 next
Avec Qwen 3 next (documentation : http://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d et test sur Qwen Chat) Alibaba propose un nouveau modèle de langage open...
Hunyuan image
Hunyuan image (documentation https://github.com/Tencent-Hunyuan/HunyuanImage-2.1 et démonstration https://huggingface.co/spaces/tencent/HunyuanImage-2.1) est un modèle de génération open source et gratuit de Tencent qui génère...
Apertus
Apertus (téléchargement : https://huggingface.co/swiss-ai et espace de test gratuit et illimité sur Public AI Inference Utility : https://chat.publicai.co/ ) est...
HunyuanVideo-Foley
HunyuanVideo-Foley (description : https://huggingface.co/tencent/HunyuanVideo-Foley et démonstration : https://huggingface.co/spaces/tencent/HunyuanVideo-Foley) sonorise des vidéos à partir de l’original et d’une instruction (optionnelle). Jusqu’à...
Gpt-oss
Gpt-oss (démonstration : https://gpt-oss.com/ et documentation : https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4) : deux modèles de langage open source produits et mis à disposition...
TripoSG-Scribble
TripoSG-Scribble (Démonstration https://huggingface.co/spaces/VAST-AI/TripoSG-scribble et documentation : https://github.com/VAST-AI-Research/TripoSG) génère des images 3D à partir d’un dessin à main levée ou d’une...
Qwen image edit
Qwen Image Edit (démonstration : https://huggingface.co/spaces/Qwen/Qwen-Image-Edit et documentation : https://huggingface.co/Qwen/Qwen-Image-Edit, également disponible sur Qwen Chat) modifie une image source à...
Ernie 4.5
Ernie 4.5 (documentation : https://github.com/PaddlePaddle/ERNIE) est un modèle de langage développé par Baidu décliné en plusieurs versions de 0,3 B...
ThinkSound
ThinkSound (démo : https://huggingface.co/spaces/FunAudioLLM/ThinkSound et documentation : https://github.com/FunAudioLLM/ThinkSound) génère la bande son de vidéos en la synchronisant et en ajoutant...
Gemma 3n
Gemma 3n (à tester dans Google ai studio ou sur les espaces Hugging Face) : deux modèles de langage open...
Stepfun
Stepfun (https://stepfun.ai/) est un chatbot de génération de texte et images qui propose plusieurs modèles et un agent : Le...
Sparc3D
Sparc3D (disponible via https://hitem3d.ai/, documentation : https://lizhihao6.github.io/Sparc3D) est un modèle de génération d’images 3D à partir d’une image. Export glb,...
Kyutai STT
Kyutai STT (https://kyutai.org/next/stt) est le modèle « speech to text » de Kyutai, disponible en deux versions open source : Ces modèles...
Ainee
Ainee (https://www.ainee.com) accompagne la compréhension de documents, unique, dans une bibliothèque ou regroupés en dossiers dans une base de connaissances,...
Ace-step
Ace-Step (https://huggingface.co/spaces/ACE-Step/ACE-Step) est un modèle de génération de musique open source (documentation : https://ace-step.github.io/).Génération à partir de paroles et de...
AudioX
AudioX (https://huggingface.co/spaces/Zeyue7/AudioX) génère des sons et musiques à partir d’une instruction et peut les lier à une vidéo.Sons et extrait...
Bagel
Bagel (démo : https://demo.bagel-ai.org/ et documentation : https://github.com/ByteDance-Seed/Bagel) est un modèle multimodal open source de ByteDance incluant texte, image et...
Open Knowledge Maps
Open Knowledge Maps (https://openknowledgemaps.org/) génère une carte des connaissances scientifiques à partir d’un sujet donné en se basant sur les...
Llama Tutor
Llama Tutor (https://llamatutor.together.ai/ et documentation : https://github.com/Nutlope/llamatutor) est un chatbot basé sur Llama 3.1 configuré pour accompagner les apprentissages en...
Superexpert
Superexpert (https://superexpert.ai, espace de démonstration : https://demo.superexpert.ai et téléchargement : https://github.com/Superexpert/superexpert-ai) permet la création de chatbots personnalisés. Open source, il...
Hunyuan 3D
Hunyuan 3D (https://3d.hunyuan.tencent.com. Open source, documentation : https://huggingface.co/tencent/Hunyuan3D-2) génère des modèles 3D avec texture depuis une instruction ou une image....
Magi
Magi (https://sand.ai/magi) génère des vidéos à partir d’une image.L’extension des vidéos générées est possible avec conservation des éléments présents dans...
Bitnet B 1.58
Bitnet B 1.58 (Documentation : https://huggingface.co/microsoft/bitnet-b1.58-2B-4T et chatbot sur Huggingface : https://huggingface.co/spaces/suayptalha/Chat-with-Bitnet-b1.58-2B-4T) est un modèle de langage open source de...
Hidream
Hidream (Modèles et documentation : https://huggingface.co/collections/HiDream-ai/hidream-i1-67f3e90dd509fed088a158b3) est un modèle de génération d’images open source disponible en trois versions dev, full...
Llama 4
Llama 4 (présentation sur https://www.llama.com) est le nouveau modèle de langage de Meta disponible en deux versions, Scout (démo :...
Deepsite
Deepsite (https://huggingface.co/spaces/enzostvs/deepsite) génère une page de code unique à partir d’une instruction pour créer des applications ou pages web. Le...
Docs
Docs (https://docs.numerique.gouv.fr) est un traitement de texte collaboratif avec des fonctionnalités d’IA générative : génération de texte à partir d’un...
Wan 2.1
Wan 2.1 est un modèle de génération de vidéos open source d’Alibaba (documentation : https://github.com/Wan-Video/Wan2.1, démonstration : https://huggingface.co/spaces/Wan-AI/Wan2.1 et site...
DiffRhythm
DiffRhythm (description : https://aslp-lab.github.io/DiffRhythm.github.io/ et test : https://huggingface.co/spaces/ASLP-lab/DiffRhythm) génère des morceaux de musique avec paroles à partir des paroles minutées...
Aya
Aya de « Cohere For AI » (https://cohere.com/research/aya) : 3 modèles de langage et 2 d’analyse d’images issus d’un projet de recherche...
Open Deep Research
Open Deep Research (description : https://huggingface.co/blog/open-deep-research et espace démo : https://huggingface.co/spaces/m-ric/open_Deep-Research ) est l’agent de recherche « avec raisonnement » développé par...
Mind Map Wizard
Mind Map Wizard (https://mindmapwizard.com) génère des cartes heuristiques à partir d’une instruction (limite de 150 caractères).Édition au format texte, partage...
Zonos
Zonos (description : https://www.zyphra.com/post/beta-release-of-zonos-v0-1#zonos_2, espace de test : https://playground.zyphra.com/audio) met en voix un texte collé. 4 voix expressives et 6...
Tulu 3
Tülu 3 450B (https://playground.allenai.org) est un modèle de langage de l’institut de recherche américain à but non lucratif AI2 (https://allenai.org)....
Janus Pro
Janus Pro (description : https://huggingface.co/deepseek-ai/Janus-Pro-7B) est un modèle d’images de Deepseek. Multimodal. Performant en analyse d’images, plus aléatoire en génération...
Open Canvas
Open Canvas (https://opencanvas.langchain.com) ajoute une génération interactive à un chatbot à la manière des canvas de ChatGPT ou des artifacts...
PocketPal
PocketPal (https://github.com/a-ghorbani/pocketpal-ai) permet d’installer un LLM léger directement dans son téléphone iOS ou Androïd et de l’utiliser dans un chatbot...
Lucie
Lucie (https://huggingface.co/OpenLLM-France/Lucie-7B) : modèle de langage 🇫🇷 , entièrement open source, adapté à des usages comme l’éducation. Développé par le consortium...
SPAR 3D
SPAR 3D (https://huggingface.co/spaces/stabilityai/stable-point-aware-3d…) transforme une image 2D en image 3D. Après avoir supprimé le fond et isolé l’objet, transforme en...
Phi 4
Phi 4 (https://huggingface.co/microsoft/phi-4) dernière version du LLM / SLM (Small Model) de Microsoft est mis à disposition en open source...
Omnicontrol
Omnicontrol (https://huggingface.co/spaces/Yuanshi/OminiControl…) génère des images à partir d’une image source et d’une instruction. Génération basée sur un modèle d’analyse de...
Trellis 3D
Trellis (https://huggingface.co/spaces/JeffreyXiang/TRELLIS…) génère un modèle #3D à partir d’une ou plusieurs images. Fond effacé automatiquement et réglages fins disponibles. Export...
Shou Xin
Shou Xin (https://huggingface.co/Datou1111/shou_xin…) génère des images sous forme de dessin au crayon en n&b ou couleur – basé sur Flux....
Deepseek
Deepseek (https://chat.deepseek.com) : modèle de langage avec raisonnement. Edit au 22/01/2025 Deepseek propose désormais Deepseek R1, concurrent direct des derniers...
Nemotron 70B
Nemotron 70B de @nvidia (https://build.nvidia.com/nvidia/llama-3_1-nemotron-70b-instruct…) est un modèle de langage basé sur Llama 70B, avec de meilleurs résultats que GPT4o...
Magic Quill
Magic Quill (https://huggingface.co/spaces/AI4Editing/MagicQuill…) permet de générer de nouvelles parties d’une image dans des parties sélectionnées. Plusieurs tailles de sélection et...
Stable Diffusion 3.5
Stable Diffusion 3.5 (https://stability.ai/news/introducing-stable-diffusion-3-5…) est le dernier modèle de génération d’images de @StabilityAI. Disponible en deux versions : large et...
Hermes 3
Hermes 3 (https://lambda.chat/chatui/) est un modèle de langage basé sur Llama 3.1 annoncé avec des capacités de raisonnement plus importantes...
SVG Studio
SVG Studio (https://svgstud.io) propose deux outils centrés autour du format SVG : un générateur aux fonctions avancées basé sur Stable...
ToonCrafter
ToonCrafter (https://huggingface.co/spaces/Doubiiu/tooncrafter…) génère une très courte vidéo à partir de deux images, une de début et une de fin. Réglages...
Molmo
Molmo (chatbot : https://molmo.allenai.org) : un modèle de langage multimodal open source pour analyses / conversations autour d’images.Description : https://molmo.allenai.org/blog....
Flux pro
Flux pro (https://replicate.com/black-forest-labs/flux-pro) est un nouveau modèle de génération d’images avec gestion de la génération de texte dans l’image performante....
Qwen 2
Qwen 2 (projet : https://huggingface.co/Qwen et demo sur Hugging Face : https://huggingface.co/spaces/Qwen/Qwen2-57b-a14b-instruct-demo…) est un modèle de langage open source développé...
Auraflow
Auraflow (https://huggingface.co/spaces/multimodalart/AuraFlow…) est un nouveau modèle de génération d’images opensource de 6,8 Mds de paramètres (documentation : https://huggingface.co/fal/AuraFlow). Fonctions avancées...
Swift
Swift (https://swift-ai.vercel.app) : un assistant vocal basé sur LLama développé par Groq, Cartesia et Vercel. Réaction rapide permet les conversations...
Pdf to chat
Pdf to chat (http://pdftochat.com) propose l’analyse de documents pdf via un chatbot avec des outils de lecteur pdf. Itération et...
Morphic
Morphic (http://morphic.sh) : moteur de recherche open source couplé à une IA générative texte. Réponse avec demande de précision, sources,...
Notes GPT
Notes GPT (http://usenotesgpt.com) retranscrit les notes audio en éléments d’une liste à cocher et en propose le résumé. Génération via...
Image to music
Image to music (https://imagetomusic.top) génère une musique avec une image. Sans compte et open sourceTests (img wikimedia): – Goéland :...
SDXL Lightning
SDXL Lightning (https://fastsdxl.ai), basé sur Stable Diffusion XL, génère des images en temps réel. « Seed » disponible. Gratuit, sans compte, illimité...
Stable Cascade
Stable Cascade (https://stability.ai/news/introducing-stable-cascade…) est le nouveau modèle de génération d’images de @StabilityAI, plus rapide et moins gourmand en ressources. En...
OpenGPTs
Les OpenGPTs (https://opengpts-example-vz4y4ooboq-uc.a.run.app Documentation sur Github : https://github.com/langchain-ai/opengpts…) : des chatbots personnalisables à la manière des GPT OpenAI. 6 LLM...
Assistants HuggingChat
HuggingChat propose désormais ses assistants (https://huggingface.co/chat/assistants) : configurables gratuitement avec compte HuggingFace puis partageables et accessibles sans compte. 6 modèles...
Image Mixer
Image Mixer (https://cloud.lambdalabs.com/demos/lambda/image-mixer-demo…) génère une image à partir d’une série d’URL, textes ou images (5 maxi), chaque source pouvant avoir...
Paint AI
Paint AI (https://paintai.groupmind.co.uk) : un outil de dessin simple… sans outils ! Outils générés à la demande à partir d’un...
AI Comic Factory
AI Comic Factory (https://huggingface.co/spaces/jbilcke-hf/ai-comic-factory) créé 2 planches de BD à partir d’un prompt, d’un style et d’un choix de gabarit....
Turbo Art
Turbo Art (https://turbo.art) génère des #images à partir d’un prompt et permet d’interagir en temps réel via des outils de...
Fast SDXL
Fast SDXL (https://huggingface.co/spaces/openskyml/fast-sdxl-stable-diffusion-xl…) : outil de génération d’image basé sur Stable Diffusion XL. Génération d’une image en 20s environ avec...
SDXL turbo
SDXL turbo (version beta : https://clipdrop.co/stable-diffusion-turbo…) est le dernier modèle de génération d’images de Stable Diffusion @StabilityAI (description :https://stability.ai/news/stability-ai-sdxl-turbo). Images...
Stable Vidéo Diffusion
Stable Vidéo Diffusion (https://stability.ai/news/stable-video-diffusion-open-ai-video-model…) génère de courtes vidéos à partir d’une image. Sur liste d’attente mais 2 lieux de test...
Illusion Diffusion HQ
Illusion Diffusion HQ (https://huggingface.co/spaces/AP123/IllusionDiffusion) permet de créer des illusions d’optique à partir d’une illusion proposée ou importée et d’un prompt....
Idefics
Idefics (https://huggingface.co/spaces/HuggingFaceM4/idefics_playground…), modèle de langage visuel, répond aux questions posées sur des images. Accepte le FR, réponse en EN. Gratuit,...
Waveformer
Waveformer (https://waveformer.replicate.dev) génère un morceau de musique jusqu’à 30 sec à partir d’un prompt, basé sur MusicGen. Export audio ou...
FlashcardX
FlashcardX (https://ai.flashcardx.com) crée des flash cards à partir d’un texte copié collé. Gratuit, open source et compte non obligatoire. Source...
Ask2end
Ask2end (ask2end.com) : une question posée sur un sujet donné, Ask2End y répond puis produit une nouvelle question / réponse...
Transvibe
Transvibe (https://transvribe.com) permet l’interrogation d’une vidéo Youtube via un chatbot. Exportation de la transcription possible. Gratuit et sans compte.
Semantic Scholar
Semantic Scholar (http://semanticscholar.org) utilise l’IA dans son moteur de recherche d’articles scientifiques (base de 200M) et fait des liens entre...
AiPage
AiPage (http://AiPage.dev) : un prompt (en anglais) et une page d’accueil en html est générée. Modifications directes possibles, export html. Opensource...
LLAMA
Envie de tester Llama2, modèle open source de @MetaAI ? 3 outils découverts : – démo de @a16z : https://llama2.ai...
Pollinations
Pollinations (https://pollinations.ai -> https://replicate.com/pollinations) : IA générative d’images gratuite et sans compte. Une galerie d’images, un emplacement pour un prompt...
MusicGen
MusicGen de Facebook est en démo sur Huggingface (https://huggingface.co/spaces/facebook/MusicGen) : un prompt avec un morceau de musique en possible inspiration...
The infinite drum machine
The infinite drum machine (https://experiments.withgoogle.com/ai/drum-machine/…) : quand l’IA classe et cartographie en autonomie des sons du quotidien pour permettre de...
Zoo
Zoo (https://zoo.replicate.dev) : 7 modèles d’IA génératives d’images (3 stable diffusion, dall-e, kandisky, deepfloyd et material-diffusion) dans le même outil...
Teach anything
Teach anything (https://teach-anything.com) : une question posée avec langue et niveau de réponse choisis et une explication est générée.