Guide de l'utilisateur
Espace de travail Nitro

Outil Intelligent document Processing (IDP)

Les PDF contiennent des données précieuses que les utilisateurs ont souvent besoin d’extraire et d’utiliser dans d’autres applications. Ces données peuvent inclure des tables de points de données ou des formulaires structurés, nécessitant que les utilisateurs transfèrent et manipulent manuellement ces informations. Les progrès technologiques, tels que le traitement intelligent des document (IDP), ont considérablement rationalisé ce processus.

IDP exploite l’apprentissage automatique, le traitement du langage naturel et la vision par ordinateur pour automatiser l’extraction, l’interprétation et l’intégration des données des documents et des PDF dans d’autres outils.

Key Nitro IDP outil

Chez Nitro, nous pensons que les systèmes IDP changent la donne pour les organisations gérant de grands volumes de document , offrant des augmentations majeures en termes de vitesse, de précision et d’efficacité par rapport aux processus manuels.

C’est pourquoi nous avons créé le premier outil IDP de Nitro, Table Extract et formulaire Extract.

Extraction de tableau : identifie et extrait automatiquement les données des tableaux dans les fichiers PDF, même des tableaux sans bordures visibles ou avec des cellules fusionnées. Cela facilite le traitement plus efficace des données dans des programmes tels qu’Excel.

Extrait : Capture les données textuelles du formulaire en PDF ainsi que les étiquettes (par exemple, Nom : John Doe, Téléphone : (555) 543 123), simplifiant ainsi les tâches de collecte de données.

Cas d’utilisation de l’outil Table Extract et du formulaire Extract de Nitro

Table Extract et formulaire Extract ont de nombreuses applications pour vous aider à extraire des données rapidement et avec précision. Voici quelques cas d’utilisation courants de ces outils utiles :

  1. Saisie automatisée des données : formulaire Extract peut automatiser le processus de saisie des données en extrayant des informations à partir de formulaires, de factures et de reçus, réduisant ainsi les erreurs de saisie manuelle et augmentant l’efficacité.
  2. Conformité et audit : Table Extract peut aider à la conformité et à l’audit en extrayant des données pertinentes d’une variété de documents, tels que des rapports financiers et des contrats, en veillant à ce que toutes les informations nécessaires soient facilement accessibles et conformes aux exigences réglementaires.
  3. Traitement des prêts : Dans le secteur des services financiers, l’extrait de formulaire peut être utilisé pour rationaliser le traitement des demandes de prêt en extrayant les données des documents justificatifs, ainsi que les données de l’étiquette, ce qui accélère les processus de prise de décision.
  4. Extract permet d’accélérer le traitement des sinistres workflow dans le secteur de l’assurance en extrayant les données du formulaire de sinistre et du document justificatif, puis en les mettant à disposition de l’outil de traitement.

Ces cas d’utilisation illustrent comment l’outil IDP de Nitropeut être utilisé pour améliorer les processus de gestion document , réduire les coûts opérationnels et améliorer l’efficacité globale dans divers secteurs.

Comment maximiser les performances

Les tableaux et les formulaires peuvent avoir une grande variété de formats, tels que des étiquettes à l’intérieur de la casse ou des tableaux avec juste des lignes sous les totaux. Pour maximiser les performances et la précision de notre outil d’extraction de données, voici quelques conseils :

  1. Assurez-vous que le texte de votre document est dans une langue prise en charge par notre outil, qui comprend actuellement l’anglais, l’espagnol, l’allemand, l’italien, le français et le portugais.
  2. Utilisez un PDF de haute qualité avec une résolution d’au moins 150 DPI.
  3. Assurez-vous que les tableaux sont clairement séparés des autres éléments de la page, en évitant les superpositions sur les images ou les motifs complexes.
  4. Gardez le texte du tableau à la verticale, et non pivoté par rapport à d’autres textes de la page.

Vous pouvez rencontrer des résultats incohérents lors de l’extraction de texte à partir de tableaux si :

  • Il y a des cellules de tableau fusionnées sur plusieurs colonnes.
  • Les tableaux comprennent des cellules, des lignes ou des colonnes qui diffèrent des autres parties du même tableau.

Scores de confiance

Vous verrez un score de confiance (nombre compris entre 0 et 1) à côté des tables extraites dans la sortie du document Excel, indiquant la probabilité qu’il s’agisse d’une table qui a été extraite.

excelconfidencescores.png

Notre outil d’extraction de tableaux peut détecter et extraire des données d’une grande variété de styles de tableaux, qu’ils aient des bordures, de petites polices ou qu’ils soient intégrés dans des images. Certains contenus, lorsqu’ils sont visualisés par un œil humain, peuvent être discutables, qu’il s’agisse d’un tableau ou non, de la même manière avec notre outil. Nous avons donc inclus un score avec chaque extraction de table, qui décrit notre degré de confiance dans le fait que chaque bloc de données est une table de données.

Dans les situations où il y a des questions délicates, comme les décisions financières, vous pourriez avoir besoin de la confiance de 0.9, mais pour quelque chose comme l’archivage de notes manuscrites, un seuil de 0.5 pourrait être acceptable. Ou dans le cas où un seuil est inférieur à 0.9, vous devrez peut-être effectuer un examen manuel plus élevé avant de l’utiliser.

Limitations

Actuellement, la taille maximale de fichier pouvant être utilisée avec l’outil d’extraction de table ou de formulaire est de 25Mo. Il y a également une limite de 100 pages dans un seul document. De plus, pour éviter les abus de l’outil et gérer la surutilisation par plusieurs utilisateurs, il existe un plafond maximum par compte pour l’utilisation des extraits de tableaux et de formulaires.

Fonctionnalités bêta

Ces outils sont proposés en tant que fonctionnalité bêta, ce qui signifie qu’ils sont entièrement fonctionnels et sécurisés, mais Nitro recueille les commentaires de nos utilisateurs pour les optimiser en fonction de leurs besoins. Veuillez nous faire part de vos commentaires sur vos expériences avec l’outil ici.

Sécurité des données et confidentialité

Vos documents ne sont traités que pour vos besoins, le contenu n’est pas utilisé pour entraîner des modèles et les données ne sont stockées que temporairement dans le cadre du traitement. Pour en savoir plus sur nos politiques de traitement des données et sur la manière dont nous sécurisons vos données, veuillez consulter notre Trust Center.

Comment désactiver les fonctionnalités de traitement intelligent de l'document

L’administrateur du compte Nitro a la possibilité de désactiver les fonctionnalités IDP dans l’outil qu’il utilise via le portail Nitro Admin . Veuillez vous référer au guide d’utilisation du portail d’administration pour savoir comment procéder.

Pour gérer la visibilité de l’outil et des services d’IDP :

  1. Connectez-vous au portail Nitro Admin.
  2. Dans le portail Nitro Admin, choisissez Paramètres dans la barre de navigation latérale.
  3. Choisissez l'onglet Préférences.
  4. Décochez la section "Enable Advanced outil".

Pour en savoir plus sur la gestion des autorisations dans votre compte Nitro , veuillez consulter notre guide d’utilisation.