OCR Mistral AI

Rendez vos documents scannés intelligents : indexés pour la recherche, exploitables par l’IA JNLP.

Les bénéfices

Le module OCR Mistral permet d’extraire automatiquement le texte présent dans des documents image (PDF scannés, images, etc.) grâce au service OCR de Mistral. Les contenus ainsi reconnus sont indexés dans la plateforme Jalios et transmis au module JNLP, l’intelligence artificielle de Jalios, pour enrichir les analyses et recommandations.

  • Rendez vos documents non textuels accessibles à la recherche ;

  • Alimentez l’IA JNLP avec des contenus enrichis ;

  • Valorisez vos archives et documents scannés ;

  • Fonctionnement automatique.

Les fonctionnalités

  • Traitement OCR des images et PDF contenant du texte au format image (document scanné) ;

  • Indexation du contenu textuel extrait ;

  • Intégration directe avec le module JNLP ;

  • Prise en charge de multiples formats de fichiers.

Les clients aiment

Une meilleure exploitation de leur fond documentaire.
L’amélioration significative de la pertinence des résultats JNLP.

Informations détaillées

Déposer le module via l'administration et redémarrer l'application.

  • Nom technique jcmsplugin.mistralocr.api.key
  • Nom technique jcmsplugin.mistralocr.api.model
  • Nom technique jcmsplugin.mistralocr.upload-service
  • Nom technique jcmsplugin.mistralocr.categorize-docs.root
  • Nom technique jcmsplugin.mistralocr.pdf-image-only

Évolutions

  • Ajout d'une option pour restreindre l'OCR aux PDF uniquement composé d'images/scan
  • Ajout de la pagination dans le résultat OCR, pour la prise en charge dans l'embeddings JNLP
  • Amélioration de la compatibilité JNLP avec l'intégration des traitements au processus d'embeddings
  • Première version du module

Sur le même thème...