Un jour, un outil d'IA générative

Mistral OCR 4 (https://console.mistral.ai/build/document-ai/ocr-playground et documentation : https://docs.mistral.ai/models/model-cards/ocr-4-0) extrait et structure le contenu de documents.

Il succède à Mistral OCR 3 en ajoutant la localisation précise de chaque élément (boîtes englobantes avec coordonnées), leur classification par type (titre, tableau, équation, image, texte) et des scores de confiance.

Prends en compte l’écriture manuscrite.
Formats acceptés : PDF, DOC, PPT et OpenDocument.
Prise en charge de 170 langues.

L’interface « Document AI » du Studio propose trois onglets de résultat : texte brut, Markdown et Visuel.
L’onglet Visuel intègre la traduction dans l’une des 170 langues disponibles.

Le téléchargement produit un fichier Markdown global et, par page, un sous-dossier avec un fichier Markdown, les images extraites en JPEG et les liens détectés (hyperlinks.md).

Accessible gratuitement depuis « Document AI » dans le Studio de Mistral avec un compte gratuit.
10 documents maximum de 50 Mo chacun par session.
Quota affiché dans le Studio se réinitialise tous les 2 jours, nombre de pages non spécifié (130 pages traitées en test sans impact observé sur le compteur).


Source pour les tests : 4 chapitres du dossier «  Intelligences artificielles en éducation – Repères, ressources et activités pour la classe » de Réseau Canopé, https://www.reseau-canope.fr/ia-et-education/dossier-ia-generatives-en-education