Utilisation de l’OCR dans Nitro PDF Pro
OCR (reconnaissance optique de caractères) est le processus de conversion d’une image bitmap de texte (comme un document numérisé) en texte qui peut être sélectionné, copié et recherché par Nitro PDF Pro et d’autres logiciels d’édition de texte. Une fois que le texte a été reconnu par OCR, il est placé sur un calque invisible au-dessus de l’image du texte que vous pouvez voir. Lorsque vous copiez du texte, le texte est copié à partir de ce calque OCR invisible. La technologie OCR ne produira pas un rendu parfait du texte bitmap. Vous devrez relire et modifier le texte résultant de l’OCR.
OCR automatique
- Ouvrez un fichier PDF numérisé dans Nitro PDF Pro.
- Une boîte d’alerte s’ouvre avec le message suivant :
« Ce document semble avoir été scanné. Souhaitez-vous effectuer une reconnaissance optique de caractères (OCR) dessus? L’OCR vous permettra de sélectionner le texte. - Trois options s’offrent à vous :
- Annuler: Aucune OCR ne sera effectuée.
- Page OCR : L’OCR sera effectuée sur la page courante.
- Document OCR : Si votre document comporte plusieurs pages, l’OCR sera effectuée sur toutes les pages.
Choisissez les langues reconnues par OCR dans Préférences > OCR. (Préférences de l’utilisateur).
Pendant que Nitro PDF Pro effectue l’OCR, une barre de progression apparaîtra. L’opération peut prendre quelques secondes ou beaucoup plus, selon la taille et le contenu du document numérisé.
OCR manuel
Pour effectuer l’OCR manuellement, choisissez Modifier > page OCR. Nitro PDF Pro commence à effectuer l’opération OCR et la barre de progression apparaît.
Forcer l’OCR
Nitro PDF Pro regarde le document et s’il voit une image de la taille d’une page, il suppose que le document est une numérisation et propose automatiquement d’effectuer une OCR. Dans certains cas, Nitro PDF Pro peut ne pas reconnaître un document numérisé. Dans le menu Edition, la page OCR sera grisée et ne pourra pas être sélectionnée.
- Maintenez les touches Commande et Option enfoncées ensemble.
- Choisissez Modifier > page OCR dans le menu.
OCR par lots
(Fonction avancée de Nitro PDF Pro). Voir OCR par lots.
Conseils pour améliorer les résultats de l’OCR
- La qualité du document original affecte la qualité de la performance de l’OCR. Des originaux nets et propres avec un texte clair produiront de bien meilleurs résultats que des photocopies froissées et fanées.
- Placez votre document original sur le scanner aussi droit que possible. Si vous avez une page numérisée qui n’est pas droite, vous pouvez « redresser », ou redresser, l’image dans Nitro PDF Pro en choisissant Modifier > Deskew et Ajuster l’image...
- Augmentez le contraste de votre document numérisé afin que l’arrière-plan soit aussi blanc que possible. Vous pouvez ajuster le contraste de l’image en choisissant Modifier > Deskew et Ajuster l’image...
Dictionnaires et OCR
Les dictionnaires médicaux et juridiques sont inclus dans le moteur OCR de Nitro PDF Pro pour améliorer la qualité de la sortie OCR pour les documents numérisés en reconnaissant les mots spécifiques aux professions médicales et juridiques. Cette fonctionnalité est intégrée, il n’est donc pas nécessaire d’activer ou d’ajuster un paramètre. Si vous choisissez de modifier le texte OCR, les mots mal orthographiés du texte sélectionné peuvent s’afficher avec un soulignement ondulé rouge.