PDFpen logo PDFpen SmileOnMyMac logo
 

Aide : OCR (reconnaissance optique des caractères)

L'OCR (reconnaissance optique des caractères) est la procédure qui permet de convertir des images bitmap contenant du texte (tel un document numérisé) en texte qui peut être sélectionné, copié et recherché par PDFpen et d'autres logiciels d'édition de textes.

La technologie OCR ne produira pas un rendu parfait des textes bitmapés. Vous devrez relire et éditer le texte qui résulte de l'OCR.

Utilisation de l'OCR dans PDFpen

  1. Ouvrez un document PDF qui a été numérisé (scanné) dans PDFpen.
  2. Une boîte d'alerte s'ouvre contenant le message « Ce document semble avoir été numérisé (scanné). Souhaitez-vous effectuer une reconnaissance optique des caractères (OCR) ur celui-ci ? ». Vous disposez alors de trois options :
    • Annuler
      Aucune OCR ne sera effectuée.
    • OCR de la page
      Une OCR sera faite sur la page actuelle.
    • OCR du document
      Si votre document contient de multiples pages, l'OCR sera effectuée sur toutes les pages.

Lorsque PDFpen est en train d'effectuer l'OCR, une barre de progression apparaîtra. Cette opération peut prendre plusieurs secondes ou plus, selon la taille du document numérisé (scanné) et de son contenu.

Pour effectuer manuellement une OCR, choisissez Édition > OCR. PDFpen commence alors à effectuer l'OCR et une barre de progression apparaît.

Sélectionner, copier et corriger du texte reconnu par l'OCR

Le texte généré par l'opération d'OCR peut être édité comme tout autre texte. Cf. travailler avec du texte.

Recherche du texte issu d'une OCR

Le texte généré par l'opération d'OCR peut être recherché comme tout autre texte. Cf. recherche à l'intérieur d'un fichier PDF.

Astuces pour améliorer les résultats de l'OCR de votre document :

  • La qualité du document original affecte la qualité de l'opération de reconnaissance optique des caractères (OCR). Des documents originaux, en bon état, non froissés, non tâchés et avec un texte contrasté produiront de meilleurs résultats avec l'OCR que des documents photocopiés, froissés, tâchés et pâles.
  • Placez votre document original dans votre scanner aussi droit que possible. Si vous utilisez un document PDF qui n'est pas droit, utilisez un logiciel pour faire pivoter votre document avant de l'ouvrir avec PDFpen.
  • Augmentez le contraste de vos documents numérisés afin que le fond soit aussi blanc que possible.

Comment forcer PDFpen à effectuer une OCR

PDFpen regarde si le document n'est composé que d'une seule image qui fait la taille de la page. Si tel est le cas, PDFpen présume que le document a été numérisé (scanné) et offre alors la possibilité d'effectuer une OCR. Dans certains cas, PDFpen peut ne pas reconnaître un document numérisé (scanné). À partir du menu Édition > OCR..., l'option sera grisée et impossible à sélectionner.

  1. Maintenez enfoncées à la fois la touche Commande (Pomme) et la touche Option.
  2. Choisissez Édition > OCR... à partir du menu.

  

 
 
© 2003-2009 SmileOnMyMac, LLC. Tous droits réservés.
SmileOnMyMac, PDFpen et PDFpenPro sont des marques déposées de SmileOnMyMac, LLC.