Uso del OCR en Nitro PDF Pro
El OCR (reconocimiento óptico de caracteres) es el proceso de convertir una imagen de mapa de bits de texto (como un documento escaneado) en texto que puede ser seleccionado, copiado y buscado por Nitro PDF Pro y otros programas de edición de texto. Una vez que el texto ha sido reconocido por el OCR, se coloca en una capa invisible sobre la imagen del texto que se puede ver. Cuando copie un texto, el texto se copiará de esta capa invisible de OCR. La tecnología OCR no producirá una representación perfecta del texto en mapa de bits. Deberá corregir y editar el texto resultante del OCR.
OCR automático
- Abra un PDF escaneado en Nitro PDF Pro.
- Se abre un cuadro de alerta con el mensaje:
" Este documento parece estar escaneado. ¿Le gustaría realizar en él un reconocimiento óptico de caracteres (OCR)? El OCR le permitirá seleccionar el texto." - Tiene tres opciones:
- Cancelar: No se realizará ningún OCR.
- Página OCR: El OCR se realizará en la página actual.
- OCR Documento: Si su documento tiene varias páginas, el OCR se realizará en todas ellas.
Elija qué idiomas reconoce el OCR en Preferencias > OCR. (Preferencias del usuario).
Mientras Nitro PDF Pro realiza el OCR, aparecerá una barra de progreso. La operación puede tardar unos segundos o mucho más, según el tamaño y el contenido del documento escaneado.
OCR manual
Para realizar el OCR manualmente, elija Editar > Página OCR. Nitro PDF Pro comienza a realizar la operación de OCR y aparece la barra de progreso.
Forzar OCR
Nitro PDF Pro examina el documento y si ve una imagen del tamaño de una página, asume que el documento es un escaneado y se ofrece automáticamente a realizar el OCR. En algunos casos, es posible que Nitro PDF Pro no reconozca un documento escaneado. En el menú Edición, Página OCR aparecerá en gris y no se podrá seleccionar.
- Mantenga pulsadas las teclas Comando y Opción a la vez.
- Elija Editar > Página OCR en el menú.
OCR por lotes
(Función avanzada de Nitro PDF Pro). Consulte Batch OCR.
Consejos para mejorar los resultados del OCR
- La calidad del documento original afecta a la calidad del rendimiento del OCR. Los originales nítidos y limpios con texto claro producirán resultados mucho mejores que las fotocopias arrugadas y descoloridas.
- Coloque el documento original sobre el escáner lo más recto posible. Si tiene una página escaneada que no está recta, puede "deskew", o enderezar, la imagen en Nitro PDF Pro eligiendo Editar > Deskew y Ajustar imagen...
- Aumente el contraste de su documento escaneado para que el fondo sea lo más blanco posible. Puede ajustar el contraste de la imagen eligiendo Edición > Deskew y Ajustar imagen...
Diccionarios y OCR
El motor OCR de Nitro PDF Pro incluye diccionarios médicos y jurídicos para mejorar la calidad de la salida OCR de los documentos escaneados mediante el reconocimiento de palabras específicas de las profesiones médica y jurídica. Esta función está incorporada, por lo que no es necesario encenderla ni ajustar ningún parámetro. Si decide editar el texto del OCR, las palabras mal escritas del texto seleccionado pueden aparecer con un subrayado rojo en forma de garabato.