Verwenden von OCR in Nitro PDF Pro
OCR (Optical Character Recognition) ist der Prozess, bei dem ein Bitmap-Bild von Text (wie ein gescanntes Dokument) in Text umgewandelt wird, der von Nitro PDF Pro und einer anderen Textbearbeitungssoftware ausgewählt, kopiert und durchsucht werden kann. Sobald der Text durch OCR erkannt wurde, wird er auf einer unsichtbaren Ebene über dem Bild des Textes platziert, das Sie sehen können. Wenn Sie Text kopieren, wird der Text von dieser unsichtbaren OCR-Ebene kopiert. Die OCR-Technologie sorgt nicht für eine perfekte Wiedergabe des Bitmap-Textes. Sie müssen den Text, der sich aus OCR ergibt, korrigieren und bearbeiten.
Automatisches OCR
- Öffnen Sie ein gescanntes PDF in Nitro PDF Pro.
- Es öffnet sich ein Warnfeld mit der Meldung:
" Dieses Dokument scheint gescannt zu sein. Möchten Sie eine optische Zeichenerkennung (OCR) darauf durchführen? OCR ermöglicht es Ihnen, den Text auszuwählen. " - Sie haben drei Optionen:
- Stornieren: Es wird kein OCR durchgeführt.
- OCR-Seite: OCR wird auf der aktuellen Seite ausgeführt.
- OCR-Dokument: Wenn Ihr Dokument mehrere Seiten hat, wird OCR auf allen Seiten ausgeführt.
Wählen Sie in den Voreinstellungen OCR aus, welche Sprachen von> OCR erkannt werden. (Benutzereinstellungen).
Während Nitro PDF Pro die OCR durchführt, wird ein Fortschrittsbalken angezeigt. Der Vorgang kann ein paar Sekunden oder viel länger dauern, abhängig von der Größe und dem Inhalt des gescannten Dokuments.
Manuelles OCR
Um OCR manuell durchzuführen, wählen Sie> OCR-Seite bearbeiten. Nitro PDF Pro beginnt mit der OCR-Operation und der Fortschrittsbalken wird angezeigt.
OCR erzwingen
Nitro PDF Pro schaut sich das Dokument an und wenn es ein Bild in der Größe einer Seite sieht, geht es davon aus, dass es sich bei dem Dokument um einen Scan handelt und bietet automatisch an, OCR durchzuführen. In einigen Fällen erkennt Nitro PDF Pro ein gescanntes Dokument möglicherweise nicht. Im Menü Bearbeiten wird die OCR-Seite ausgegraut und kann nicht ausgewählt werden.
- Halten Sie die Befehlstaste und die Wahltaste gleichzeitig gedrückt.
- Wählen Sie im Menü die Option> OCR-Seite bearbeiten.
Batch-OCR
(Erweiterte Funktion von Nitro PDF Pro). Siehe Batch-OCR.
Tipps zur Verbesserung der OCR-Ergebnisse
- Die Qualität des Originaldokuments wirkt sich auf die Qualität der OCR-Leistung aus. Scharfe, saubere Originale mit klarem Text führen zu viel besseren Ergebnissen als zerknitterte, verblasste Fotokopien.
- Legen Sie Ihr Originaldokument so gerade wie möglich auf den Scanner. Wenn Sie eine gescannte Seite haben, die nicht gerade ist, können" Sie das" Bild in Nitro PDF Pro verzerrt oder begradigen, indem Sie „Schräg bearbeiten>“ und „Bild anpassen“ wählen...
- Erhöhen Sie den Kontrast Ihres gescannten Dokuments, sodass der Hintergrund so weiß wie möglich ist. Sie können den Kontrast des Bildes anpassen, indem Sie Bearbeiten>, Neigung und Bild anpassen wählen...
Wörterbücher und OCR
Medizinische und juristische Wörterbücher sind in der OCR-Engine von Nitro PDF Pro enthalten, um die Qualität der OCR-Ausgabe für gescannte Dokumente zu verbessern, indem Wörter erkannt werden, die für medizinische und juristische Berufe spezifisch sind. Diese Funktion ist integriert, sodass Sie keine Einstellung einschalten oder anpassen müssen. Wenn Sie sich dafür entscheiden, OCR-Text zu bearbeiten, werden falsch geschriebene Wörter für den ausgewählten Text möglicherweise mit einer roten, verschnörkelten Unterstreichung angezeigt.