Sommaire
Maîtriser l'analyse de documents avec le générateur d'API de Mindee
L'analyse des documents, c'est-à-dire l'extraction d'informations structurées à partir de documents non structurés ou semi-structurés, est un aspect crucial de nombreux processus métier. Qu'il s'agisse d'extraire des données de factures, de formulaires fiscaux ou de tout autre document structuré, la capacité d'analyser les documents avec précision et rapidité peut considérablement rationaliser les opérations. Nous proposons un outil puissant permettant aux développeurs de créer leurs API d'analyse de documents personnalisées. Dans cet article de blog, nous vous expliquerons les étapes à suivre pour créer votre propre API d'analyse de documents à l'aide de Mindee, en nous concentrant sur le formulaire fiscal W-9 à titre d'exemple.
Conditions préalables à la création d'une API d'analyse de documents
Avant d'entreprendre ce voyage, assurez-vous de disposer des éléments suivants :
- Un compte gratuit chez nous. Assurez-vous de vous inscrire et de confirmer votre adresse e-mail.
- Un exemple de kit d'apprentissage, qui sera utilisé pour entraîner le modèle d'apprentissage automatique.

Configuration de votre API
Une fois connecté à notre plateforme :
- Cliquez sur le bouton « Créer une nouvelle API » dans l'onglet Studio.
- Fournissez des informations essentielles sur votre API d'analyse de documents personnalisée. Cela inclut le type de document (par exemple, « formulaire fiscal W-9 »), un nom d'API, une brève description et une image d'illustration.
Définition du modèle de données de votre document
Après avoir configuré votre API :
- Définissez le modèle de données en spécifiant les champs que vous souhaitez extraire du document.
- Pour chaque champ, sélectionnez son type de données (par exemple, champ de texte) et fournissez un nom de champ et une clé de réponse API.
- Pour notre exemple W-9, nous allons extraire des champs tels que le nom, l'adresse, la ville, l'État, le code postal et le numéro de sécurité sociale.

Entraîner le modèle
Une fois le modèle de données en place, il est temps d'entraîner le modèle d'apprentissage profond :
- Téléchargez vos documents de formation. Vous pouvez télécharger des fichiers individuels ou une archive zip contenant plusieurs fichiers.
- Pour chaque document téléchargé, attribuez des valeurs à chaque champ en sélectionnant les sections appropriées dans le document. Notre interface met en évidence les candidats potentiels pour chaque domaine, ce qui rend ce processus intuitif.
- Une fois que vous aurez balisé 20 documents, la formation sur le modèle débutera. Plus vous utilisez de documents, plus le modèle devient précis.
Suivi des progrès de la formation
Nous proposons une « page de formation sur les modèles » où vous pouvez :
- Suivez la progression de l'entraînement en temps réel.
- Surveillez le moment où le modèle est déployé.
- Afficher les sessions de formation qui ont été annulées.
La fréquence du recyclage des modèles varie en fonction du nombre de documents entraînés. Par exemple, pour moins de 100 documents, un nouveau modèle est entraîné tous les 20 documents. À mesure que le nombre de documents augmente, la fréquence change, ce qui garantit des performances optimales du modèle.
Utilisation du modèle entraîné
Une fois le modèle entraîné :
- Vous pouvez tester sa précision en téléchargeant de nouveaux documents. Le modèle remplira automatiquement les champs en fonction de sa formation.
- Continuez à fournir plus de données au modèle pour améliorer sa précision.
Intégration et paramètres de l'API
Avec un modèle entraîné en place :
- Accédez à l'onglet « Documentation » pour explorer les points de terminaison de votre API et télécharger la définition de l'API.
- Utilisez l'onglet « Clés API » pour générer votre première clé et tester l'API.
- L'onglet « Paramètres » vous permet de mettre à jour les informations de l'API et de télécharger la configuration du modèle de données.
Votre solution pour une extraction de données efficace
L'analyse des documents ne doit pas être une tâche fastidieuse. Grâce à notre générateur d'API, les développeurs peuvent créer des API personnalisées adaptées à leurs besoins spécifiques, garantissant ainsi une extraction de données précise et efficace. Qu'il s'agisse de formulaires fiscaux, de factures ou de tout autre document structuré, nous avons une solution robuste à tous vos problèmes d'analyse de documents. Connectez-vous au application ici ou contactez-nous pour discuter avec notre équipe.
Ce billet de blog est basé sur la documentation de Mindee. Pour plus de détails techniques sur l'analyse des documents, visitez le Docs Mindee.
À propos


.webp)
.webp)

.webp)