PDF enthalten wertvolle Daten, die Benutzer häufig extrahieren und in anderen Anwendungen nutzen müssen. Diese Daten können Tabellen mit Datenpunkten oder strukturierte Formulare enthalten, sodass Benutzer diese Informationen manuell übertragen und bearbeiten müssen. Technologische Fortschritte wie Intelligent Dokument Processing (IDP) haben diesen Prozess erheblich rationalisiert.
IDP nutzt maschinelles Lernen, natürliche Sprachverarbeitung und Computer Vision, um die Extraktion, Interpretation und Integration von Daten aus Dokumenten und PDF in andere Tools zu automatisieren.
Wichtiges Nitro IDP-Tool
Wir bei Nitro sind davon überzeugt, dass IDP-Systeme für Unternehmen, die große Mengen an Dokumenten verarbeiten, bahnbrechend sind, da sie im Vergleich zu manuellen Prozessen eine deutliche Verbesserung von Geschwindigkeit, Genauigkeit und Effizienz bieten.
Aus diesem Grund haben wir Nitroerstes IDP-Tool, Table Extract und Formular Extract, entwickelt.
Tabellenextrakt: Identifiziert und extrahiert automatisch Daten aus Tabellen im PDF, auch aus Tabellen ohne sichtbare Ränder oder mit verbundenen Zellen. Dies erleichtert die effizientere Datenverarbeitung in Programmen wie Excel.
Formularextrakt: Erfasst Textdaten aus einem Formular im PDF zusammen mit Beschriftungen (z. B. Name: John Doe, Telefon: (555) 543 123) und vereinfacht so die Datenerfassung.
Anwendungsfälle für NitroTabellenextraktions- und Formularextraktionstool
Table Extract und Formular Extract verfügen über zahlreiche Anwendungen, die Ihnen dabei helfen, Daten schnell und präzise zu extrahieren. Hier sind einige gängige Anwendungsfälle für diese hilfreichen Tools:
- Automatisierte Dateneingabe: Formular Extract kann den Dateneingabeprozess automatisieren, indem es Informationen aus Formularen, Rechnungen und Quittungen extrahiert, wodurch manuelle Eingabefehler reduziert und die Effizienz gesteigert wird.
- Compliance und Audit: Table Extract kann bei Compliance und Audit helfen, indem es relevante Daten aus einer Vielzahl von Dokumenten, wie etwa Finanzberichten und Verträgen, extrahiert und sicherstellt, dass alle notwendigen Informationen leicht zugänglich sind und den gesetzlichen Anforderungen entsprechen.
- Kreditabwicklung: In der Finanzdienstleistungsbranche kann der Formularextraktionsprozess genutzt werden, um die Bearbeitung von Kreditanträgen zu optimieren, indem Daten aus unterstützenden Dokumenten zusammen mit den Etikettendaten extrahiert werden, was den Entscheidungsprozess beschleunigt.
- Bearbeitung von Versicherungsansprüchen: Formular Extract kann den Workflow bei der Bearbeitung von Ansprüchen im Versicherungssektor beschleunigen, indem es Daten aus Anspruchsformularen und unterstützenden Dokumenten extrahiert und sie dann dem Bearbeitungstool zur Verfügung stellt.
Diese Anwendungsfälle veranschaulichen, wie das IDP-Tool von Nitrogenutzt werden kann, um die Prozesse der Dokumentenverarbeitung zu verbessern, die Betriebskosten zu senken und die Gesamteffizienz in verschiedenen Sektoren zu steigern.
So maximieren Sie die Leistung
Tabellen und Formulare können viele verschiedene Formate haben, wie etwa Beschriftungen in Boxen oder Tabellen mit nur Zeilen unter den Summen. Um die Leistung und Genauigkeit unseres Datenextraktionstools zu maximieren, hier einige Tipps:
- Stellen Sie sicher, dass der Text in Ihrem Dokument in einer von unserem Tool unterstützten Sprache vorliegt. Derzeit sind das Englisch, Spanisch, Deutsch, Italienisch, Französisch und Portugiesisch.
- Verwenden Sie ein hochwertiges PDF mit einer Auflösung von mindestens 150 DPI.
- Stellen Sie sicher, dass Tabellen klar von anderen Elementen auf der Seite getrennt sind und vermeiden Sie Überlagerungen von Bildern oder komplexe Muster.
- Halten Sie den Text in der Tabelle aufrecht und nicht gedreht im Verhältnis zum übrigen Text auf der Seite.
In folgenden Fällen kann es beim Extrahieren von Text aus Tabellen zu inkonsistenten Ergebnissen kommen:
- Es liegen zusammengeführte Tabellenzellen über mehrere Spalten hinweg vor.
- Die Tabellen enthalten Zellen, Zeilen oder Spalten, die sich von anderen Teilen derselben Tabelle unterscheiden.
Vertrauenswerte
Sie sehen neben den in der Excel -Dokumentausgabe extrahierten Tabellen einen Konfidenzwert (Zahl zwischen 0 und 1), der die Wahrscheinlichkeit angibt, dass es sich um eine extrahierte Tabelle handelt.
Unser Tool zum Extrahieren von Tabellen kann Daten aus einer Vielzahl von Tabellenstilen erkennen und extrahieren, unabhängig davon, ob diese über Rahmen oder kleine Schriftarten verfügen oder in Bilder eingebettet sind. Bei manchen Inhalten kann es für das menschliche Auge fraglich sein, ob es sich um eine Tabelle handelt oder nicht. Das ist auch bei unserem Tool der Fall. Deshalb haben wir bei jeder Tabellenextraktion eine Bewertung eingefügt, die beschreibt, wie sicher wir sind, dass jeder Datenblock eine Datentabelle ist.
In Situationen mit sensiblen Themen, wie etwa finanziellen Entscheidungen, benötigen Sie möglicherweise eine Vertrauenswürdigkeit von 0.9, aber für etwas wie die Archivierung handschriftlicher Notizen könnte ein Schwellenwert von 0.5 akzeptabel sein. Oder falls der Schwellenwert niedriger ist als 0.9, ist vor der Verwendung möglicherweise eine intensivere manuelle Überprüfung erforderlich.
Einschränkungen
Derzeit beträgt die maximale Dateigröße, die mit dem Tool zur Tabellen- oder Formularextraktion verwendet werden kann, 25MB. Es gibt auch eine Begrenzung von 100 Seiten in einem einzelnen Dokument. Um außerdem einen Missbrauch des Tool zu verhindern und die übermäßige Nutzung durch mehrere Benutzer zu verwalten, gibt es eine maximale Obergrenze pro Konto für die Verwendung von Tabellen und Formularauszügen.
Beta-Funktionen
Diese Tools werden als Beta-Funktion angeboten, was bedeutet, dass sie voll funktionsfähig und sicher sind, aber Nitro sammelt Feedback von unseren Benutzern, um sie für ihre Bedürfnisse zu optimieren. Geben Sie hier Feedback zu Ihren Erfahrungen mit dem Tool.
Datensicherheit und Datenschutz
Ihre Dokumente werden dabei nur zu Ihrem Bedarf verarbeitet, die Inhalte werden nicht zum Trainieren von Modellen verwendet und die Daten werden im Rahmen der Verarbeitung nur temporär gespeichert. Weitere Informationen zu unseren Richtlinien zur Datenhandhabung und zur Sicherung Ihrer Daten finden Sie in unserem Trust Center.
So deaktivieren Sie die intelligente Dokumentverarbeitungsfunktion
Der Nitro Kontoadministrator kann IDP-Funktionen im von ihm verwendeten Tool über das Nitro Admin Portal deaktivieren. Anweisungen hierzu finden Sie im Benutzerhandbuch des Admin-Portals.
So verwalten Sie die Transparenz des IDP-Tools und der IDP-Dienste:
- Melden Sie sich beim Nitro Admin-Portal an.
- Wählen Sie im Nitro Admin Portal in der Seitenleistennavigation „Einstellungen“ aus.
- Wählen Sie die Registerkarte Einstellungen.
- Deaktivieren Sie den Abschnitt "Erweitertes Tool aktivieren".
Weitere Informationen zum Verwalten der Berechtigungen in Ihrem Nitro-Konto finden Sie in unserem Benutzerhandbuch.