OCR gebruiken in Nitro PDF Pro
OCR (Optical Character Recognition) is het proces waarbij een bitmapafbeelding van tekst (zoals een gescand document) wordt omgezet in tekst die kan worden geselecteerd, gekopieerd en doorzocht door Nitro PDF Pro en andere tekstbewerkingssoftware. Zodra de tekst door OCR is herkend, wordt deze op een onzichtbare laag geplaatst boven de afbeelding van de tekst die u kunt zien. Wanneer u tekst kopieert, wordt de tekst gekopieerd van deze onzichtbare OCR-laag. OCR-technologie produceert geen perfecte weergave van de bitmap-tekst. U moet de tekst die uit de OCR komt proeflezen en bewerken.
Automatische OCR
- Open een gescande PDF in Nitro PDF Pro.
- Er wordt een waarschuwingsvenster geopend met het bericht:
" Dit document lijkt te worden gescand. Wilt u er optische tekenherkenning (OCR) op uitvoeren? Met OCR kunt u de tekst selecteren." - U hebt drie opties:
- Annuleren: Er wordt geen OCR uitgevoerd.
- OCR Pagina: OCR wordt uitgevoerd op de huidige pagina.
- OCR-document: Als uw document uit meerdere pagina's bestaat, wordt de OCR op alle pagina's uitgevoerd.
Kies in Voorkeuren > OCR welke talen door OCR worden herkend. (Gebruikersvoorkeuren).
Terwijl Nitro PDF Pro de OCR uitvoert, verschijnt een voortgangsbalk. De handeling kan enkele seconden of veel langer duren, afhankelijk van de grootte en de inhoud van het gescande document.
Handmatige OCR
Om de OCR handmatig uit te voeren, kiest u Bewerken > OCR-pagina. Nitro PDF Pro begint de OCR-bewerking uit te voeren en de voortgangsbalk verschijnt.
OCR afdwingen
Nitro PDF Pro bekijkt het document en als het een afbeelding ter grootte van een pagina ziet, neemt het aan dat het document een scan is en biedt het automatisch aan om OCR uit te voeren. In sommige gevallen herkent Nitro PDF Pro een gescand document niet. In het menu Bewerken wordt OCR-pagina grijs weergegeven en kan niet worden geselecteerd.
- Houd de toetsen Command en Option samen ingedrukt.
- Kies Bewerken > OCR-pagina in het menu.
Batch OCR
(Geavanceerde functie van Nitro PDF Pro). Zie Batch OCR.
Tips om de OCR-resultaten te verbeteren
- De kwaliteit van het originele document beïnvloedt de kwaliteit van de OCR-prestaties. Scherpe, schone originelen met duidelijke tekst leveren veel betere resultaten op dan verfrommelde, vervaagde fotokopieën.
- Plaats het originele document zo recht mogelijk op de scanner. "Als u een gescande pagina hebt die niet recht is, kunt u "de afbeelding rechtzetten in Nitro PDF Pro door te kiezen voor > Rechtzetten en Afbeelding aanpassen...
- Verhoog het contrast van uw gescande document zodat de achtergrond zo wit mogelijk is. U kunt het contrast van de afbeelding aanpassen door te kiezen voor Bewerken > Scheefstand en Afbeelding aanpassen...
Woordenboeken en OCR
Medische en juridische woordenboeken zijn opgenomen in de OCR-engine van Nitro PDF Pro om de kwaliteit van de OCR-uitvoer voor gescande documenten te verbeteren door woorden te herkennen die specifiek zijn voor medische en juridische beroepen. Deze functie is ingebouwd, dus u hoeft geen instelling in te schakelen of aan te passen. Als u ervoor kiest OCR-tekst te bewerken, kunnen verkeerd gespelde woorden voor de geselecteerde tekst worden weergegeven met een rode kronkelende onderstreping.