PDF's bevatten waardevolle gegevens die gebruikers vaak moeten extraheren en gebruiken in andere toepassingen. Deze gegevens kunnen tabellen met gegevenspunten of gestructureerde formulieren bevatten, waardoor gebruikers deze informatie handmatig moeten overdragen en manipuleren. Technologische vooruitgang, zoals Intelligent Document Processing (IDP), heeft dit proces aanzienlijk gestroomlijnd.
IDP maakt gebruik van machine learning, natuurlijke taalverwerking en computervisie om de extractie, interpretatie en integratie van gegevens uit documenten en PDF in andere tools te automatiseren.
Belangrijkste Nitro IDP-tools
Bij Nitro zijn we van mening dat IDP-systemen game-changers zijn voor organisaties die grote documentvolumes verwerken, en een grote boost bieden op het gebied van snelheid, nauwkeurigheid en efficiëntie in vergelijking met handmatige processen.
Daarom hebben we de eerste IDP-tools van Nitro gemaakt, Table Extract en Form Extract.
Tabelextract: Identificeert en extraheert automatisch gegevens uit tabellen in PDF's, zelfs uit tabellen zonder zichtbare randen of met samengevoegde cellen. Dit maakt het gemakkelijk om gegevens efficiënter te verwerken in programma's zoals Excel.
Formulieruittreksel: legt tekstgegevens van formulieren in PDF's vast, samen met labels (bijv. Naam: John Doe, Telefoon: (555) 543 123), waardoor gegevensverzamelingstaken worden vereenvoudigd.
Gebruiksscenario's voor Nitro's tools voor tabelextractie en formulierextractie
Table Extract en Form Extract hebben veel toepassingen om u te helpen snel en nauwkeurig gegevens te extraheren. Hier volgen enkele veelvoorkomende gebruiksscenario's voor deze handige hulpprogramma's:
- Geautomatiseerde gegevensinvoer: Form Extract kan het gegevensinvoerproces automatiseren door informatie uit formulieren, facturen en bonnen te extraheren, waardoor handmatige invoerfouten worden verminderd en de efficiëntie wordt verhoogd.
- Naleving en auditing: Table Extract kan helpen bij naleving en audits door relevante gegevens te extraheren uit een verscheidenheid aan documenten, zoals financiële rapporten en contracten, om ervoor te zorgen dat alle benodigde informatie gemakkelijk toegankelijk is en voldoet aan de wettelijke vereisten.
- Verwerking van leningen: In de financiële dienstverlening kan een formulieruittreksel worden gebruikt om de verwerking van leningaanvragen te stroomlijnen door gegevens uit ondersteunende documenten te extraheren, samen met de labelgegevens, wat de besluitvormingsprocessen versnelt.
- Verwerking van verzekeringsclaims: Form Extract kan de workflow voor de verwerking van claims in de verzekeringssector versnellen door gegevens uit claimformulieren en ondersteunende documenten te extraheren en deze vervolgens beschikbaar te stellen voor verwerkingstools.
Deze use cases illustreren hoe de IDP-tools van Nitro kunnen worden gebruikt om documentverwerkingsprocessen te verbeteren, operationele kosten te verlagen en de algehele efficiëntie in verschillende sectoren te verbeteren.
Hoe de prestaties te maximaliseren
Tabellen en formulieren kunnen een grote verscheidenheid aan indelingen hebben, zoals labels in dozen of tabellen met alleen regels onder de totalen. Om de prestaties en nauwkeurigheid van onze tools voor gegevensextractie te maximaliseren, volgen hier enkele tips:
- Zorg ervoor dat de tekst in uw document in een taal is die wordt ondersteund door onze tools, waaronder momenteel Engels, Spaans, Duits, Italiaans, Frans en Portugees.
- Gebruik een PDF van hoge kwaliteit met een resolutie van minimaal 150 dpi.
- Zorg ervoor dat tabellen duidelijk gescheiden zijn van andere elementen op de pagina en vermijd overlays op afbeeldingen of complexe patronen.
- Houd de tekst in de tabel rechtop, niet gedraaid ten opzichte van andere tekst op de pagina.
In de volgende gevallen kunt u inconsistente resultaten tegenkomen bij het extraheren van tekst uit tabellen:
- Er zijn samengevoegde tabelcellen in meerdere kolommen.
- De tabellen bevatten cellen, rijen of kolommen die verschillen van andere delen van dezelfde tabel.
Zelfvertrouwen Scores
U ziet een betrouwbaarheidsscore (nummer tussen 0 en 1) naast tabellen die zijn geëxtraheerd in de uitvoer van het Excel-document, wat aangeeft hoe waarschijnlijk het is dat het een tabel is die is geëxtraheerd.
Onze tool voor het extraheren van tabellen kan gegevens detecteren en extraheren uit een grote verscheidenheid aan tabelstijlen, of ze nu randen of kleine lettertypen hebben of zijn ingesloten in afbeeldingen. Sommige inhoud, wanneer deze door een menselijk oog wordt bekeken, kan twijfelachtig zijn of het een tabel is of niet, net als bij onze tools. Daarom hebben we bij elke tabelextractie een score opgenomen die beschrijft hoe zeker we zijn dat elk gegevensblok een tabel met gegevens is.
In situaties met gevoelige kwesties, zoals financiële beslissingen, kunt u een vertrouwen van 0nodig hebben.9, maar voor zoiets als het archiveren van handgeschreven notities, een drempel van 0.5 zou acceptabel kunnen zijn. Of in het geval dat een drempel lager is dan 0.9, heeft u mogelijk een hoger niveau van handmatige beoordeling nodig voor gebruik.
Beperkingen
Momenteel is de maximale bestandsgrootte die kan worden gebruikt met hulpprogramma's voor het extraheren van tabellen of formulieren 25MB. Er is ook een limiet van 100 pagina's in één document. Om misbruik van de tool te voorkomen en overmatig gebruik door meerdere gebruikers te beheren, is er bovendien een maximumlimiet per account voor het gebruik van tabel- en formulierextracten.
Bèta-functies
Deze tools worden aangeboden als een bètafunctie, wat betekent dat ze volledig functioneel en veilig zijn, maar Nitro verzamelt feedback van onze gebruikers om ze te optimaliseren voor hun behoeften. Geef hier feedback over uw ervaringen met de tools.
Gegevensbeveiliging en privacy
Uw documenten worden alleen verwerkt voor uw behoeften, de inhoud wordt niet gebruikt om modellen te trainen en de gegevens worden slechts tijdelijk opgeslagen als onderdeel van de verwerking. Voor meer informatie over ons beleid inzake gegevensverwerking en hoe we uw gegevens beveiligen, gaat u naar ons Vertrouwenscentrum.
Functies voor intelligente documentverwerking uitschakelen
De Nitro-accountbeheerder heeft de mogelijkheid om IDP-functies uit te schakelen in de tools die ze gebruiken via het Nitro Admin-portaal. Raadpleeg de gebruikershandleiding van de beheerdersportal voor instructies over hoe u dit kunt doen.
Om de zichtbaarheid van IDP-tools en -services te beheren:
- Log in op het Nitro Admin-portaal.
- Kies in de Nitro Admin-portal Instellingen in de zijbalknavigatie.
- Kies het tabblad Voorkeuren.
- Verwijder het vinkje in het gedeelte 'Geavanceerde tools inschakelen'.
Lees onze gebruikershandleiding voor meer informatie over het beheren van machtigingen in uw Nitro-account.