▼
Scroll to page 2
of
118
ReadirisTM Corporate 12 Guide Utilisateur ReadirisTM Corporate 12 – Guide Utilisateur Table des matières Copyright ............................................................................................ 1 Chapitre 1 Présentation de Readiris ........................................ 3 Gain de temps et élimination du travail de réencodage ..... 3 Famille de produits Readiris ............................................. 7 Chapitre 2 Installation de Readiris ........................................ 11 Configuration requise...................................................... 11 Installation du logiciel..................................................... 11 Désinstallation du logiciel............................................... 12 Enregistrement du logiciel .............................................. 13 Assistance produits ......................................................... 13 Chapitre 3 Mise en route ........................................................ 15 Exécution de Readiris ..................................................... 15 Interface utilisateur ......................................................... 16 Modification de la langue de l'interface utilisateur ......... 18 Configuration du scanner dans Readiris.......................... 18 Chapitre 4 Utilisation de Drop2Read .................................... 21 Chapitre 5 Numérisation et ouverture de documents .......... 23 Sélection du type de document ....................................... 23 Sélection des options....................................................... 24 Ouverture de fichiers image ............................................ 25 iii Table des matières Numérisation de documents papier ................................. 27 Chapitre 6 Optimisation des documents numérisés ............. 33 Chapitre 7 Zonage des documents ......................................... 39 Zonage automatique des documents ............................... 39 Zonage manuel des documents ....................................... 41 Utilisation des modèles de zonage .................................. 47 Chapitre 8 Reconnaissance des documents ........................... 51 Introduction..................................................................... 51 Sélection de la langue du document ................................ 52 Utilisation des lexiques utilisateur .................................. 56 Définition des caractéristiques du document................... 59 Utilisation de l'apprentissage interactif ........................... 60 Utilisation des dictionnaires de polices ........................... 64 Chapitre 9 Formatage et enregistrement de documents ...... 67 Formatage de documents ................................................ 67 Sélection des options de mise en page ............................ 70 Sélection des options d'image ......................................... 73 Enregistrement des documents en tant que fichiers image ................................................................................ 75 Création de documents PDF ........................................... 76 Sélection des options PDF .............................................. 78 iv ReadirisTM Corporate 12 – Guide Utilisateur Documents PDF protégés par mot de passe .................... 81 Adaptation des documents PDF ...................................... 82 Sélection de la taille de page ........................................... 83 Chapitre 10 Enregistrement et chargement des paramètres 85 Chapitre 11 Reconnaissance d'importants volumes d'images numérisées ................................................................................ 87 Traitement par lots .......................................................... 87 Configuration d'un dossier surveillé................................ 89 Chapitre 12 Séparation et indexation des lots de documents ................................................................................... 91 Séparation des lots de documents ................................... 91 Indexation des lots de documents ................................... 94 Chapitre 13 Reconnaissance de texte manuscrit................... 97 Chapitre 14 Reconnaissance des codes à barres ................... 99 Présentation de la lecture des codes à barres ................... 99 Chapitre 15 Reconnaissance des cartes de visite ................ 103 Présentation de la lecture des cartes de visite................ 103 Index .................................................................................. 109 v ReadirisTM Corporate 12 – Guide Utilisateur Copyright ReadirisCorporate12-dgi-290609-01 Copyright ©1987-2009 I.R.I.S. Tous droits réservés. I.R.I.S. détient les droits d'auteur couvrant le logiciel Readiris, le système d'aide en ligne et la présente publication. Les informations figurant dans ce document sont la propriété d'I.R.I.S. Elles sont sujettes à modification sans préavis et ne représentent pas un engagement de la part d'I.R.I.S. Le logiciel décrit dans le présent document est fourni sous accord de licence stipulant les conditions d'utilisation de ce produit. Le logiciel peut être utilisé ou copié uniquement conformément aux conditions de cet accord. Aucune partie de la présente publication ne peut être reproduite, transmise, stockée dans un système de récupération ou traduite dans une autre langue sans l'autorisation écrite préalable d'I.R.I.S. Ce guide utilisateur utilise des noms fictifs à des fins de démonstration. Les références à des personnes, sociétés ou organisations réelles sont strictement fortuites. Marques commerciales Le logo Readiris, Readiris et Drop2Read sont des marques commerciales d'Image Recognition Integrated Systems S.A. Technologies d'OCR, d'ICR et de codes à barres par I.R.I.S. Technologies AutoFormat et Linguistic par I.R.I.S. Technologies de BCR et d'analyse de champs par I.R.I.S. Technologie de compression iHQC par I.R.I.S. Le segmenteur XML a été développé par Apache. Ce produit comprend le logiciel développé par Apache Software Foundation. Tous les autres produits mentionnés dans le présent guide utilisateur sont des marques commerciales ou déposées de leurs propriétaires respectifs. 1 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 1 PRESENTATION DE READIRIS GAIN DE TEMPS ET ELIMINATION DU TRAVAIL DE REENCODAGE Introduction Merci d'avoir acheté Readiris. Ce logiciel vous apportera sans nul doute une aide précieuse dans le réencodage de vos textes, tableaux, graphismes, codes à barres et textes manuscrits. Quelle que soit l'efficacité des ordinateurs, le travail préalable de saisie des informations reste une étape incontournable. Si vous avez déjà retapé un rapport de 15 pages ou un grand tableau de chiffres, vous savez combien cette tâche peut être longue et fastidieuse. Utilisez ce logiciel d'OCR à la pointe du progrès pour convertir automatiquement des documents papier ou des fichiers image numérisés en documents modifiables et entièrement indexés qu'il est possible d'archiver et de partager. Numérisez un document imprimé ou dactylographié, indiquez les zones auxquelles Readiris doit appliquer la reconnaissance (ou laissez au système le soin de le faire pour vous), exécutez la reconnaissance des caractères et exportez le document dans votre programme de traitement de texte. Les documents comptant de nombreuses pages sont traités d'une seule traite. Quelques clics de souris vous permettent d'éviter de longues heures de travail tandis que Readiris convertit vos documents papier en fichiers 3 Chapitre 1 – Présentation de Readiris électroniques modifiables : il offre des performances 40 fois supérieures à la frappe manuelle. Pour accélérer encore davantage le processus, vous pouvez recourir à l'utilitaire Drop2Read. Il vous suffit de préciser les paramètres de base (langue de reconnaissance, format de sortie, dossier de destination et application cible) et de faire glisser vos documents numérisés vers l'icône du Dock. Vos documents seront traités à la volée. Informations générales Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est complétée par des techniques d'auto-apprentissage. Le système est capable d'apprendre de nouveaux mots et caractères grâce à une analyse contextuelle et linguistique. En d'autres termes, la précision de l'OCR s'améliore avec le temps et l'utilisation. Readiris assure également la reconnaissance des données tabulaires et les recrée sous la forme de feuilles de calcul dans votre tableur ou en tant qu'objets tableau dans votre application de traitement de texte. Les données numériques sont directement prêtes à être traitées. Readiris prend en charge jusqu'à 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris en capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel. Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc., sont écrits à l'aide des symboles occidentaux. 4 ReadirisTM Corporate 12 – Guide Utilisateur Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance et non après. En conséquence, il exécute la reconnaissance de tous les types de documents avec une précision optimale, y compris les documents de piètre qualité, les télécopies et les impressions matricielles. Il n'a aucune difficulté à traiter les documents mal copiés ou numérisés contenant des caractères trop clairs ou trop foncés. Il est en mesure de résoudre des caractères liés et de reconstituer les caractères incomplets ou fragmentés, tels que les symboles matriciels. En outre, Readiris offre une fonction de vérification utilisateur. Lorsqu'elle est activée, la fonction de vérification utilisateur (apprentissage interactif) marque les caractères considérés comme douteux par le système de reconnaissance et permet également d'améliorer la précision de la reconnaissance. Toutes les solutions que vous validez sont enregistrées temporairement dans la mémoire du système, ce qui non seulement le rend plus rapide et plus fiable au fil du temps mais également plus intelligent. Ce puissant outil d'apprentissage interactif permet également à Readiris de reconnaître des caractères spéciaux, notamment les symboles mathématiques et les signes typographiques, et de traiter les polices déformées. Pour accroître encore votre productivité, Readiris, non content d'effectuer la reconnaissance des textes, peut également les formater pour vous. Plusieurs niveaux de formatage sont disponibles. Lorsque vous utilisez le « formatage automatique », Readiris recrée une copie fidèle du document numérisé : le formatage des mots, des paragraphes et des pages du document d'origine est préservé. Le système utilise des types de caractères, des tailles et des styles similaires à ceux utilisés dans le document source pendant la reconnaissance. L'emplacement des colonnes, des blocs de texte et des images respecte également les documents d'origine. Readiris peut même inclure la photo en arrière-plan de la page numérisée dans le document de sortie de la reconnaissance. En outre, puisqu'il prend en charge la numérisation couleur et à niveaux de gris, vous 5 Chapitre 1 – Présentation de Readiris pouvez reproduire n'importe quelle image, dessin au trait, photos en noir et blanc et illustrations en couleur. Lorsqu'un document contient des tableaux, Readiris les réorganise dans de véritables cellules et recrée les bordures de cellule des tableaux d'origine. En d'autres termes, Readiris vous offre la possibilité d'archiver une copie fidèle de vos documents et de les convertir en fichiers texte compacts et modifiables au lieu de simples images numérisées. Les codes à barres présents sur une page numérisée peuvent être lus, au même titre que du texte manuscrit, pour autant qu'il soit écrit en « lettres capitales » bien espacées. Readiris vous permet même d'appliquer la reconnaissance aux cartes de visite : vous pouvez les numériser, leur appliquer la reconnaissance puis les convertir en une base de données d'adresses. Les données des cartes sont extraites automatiquement de l'image et les résultats de la reconnaissance sont affectés à des champs spécifiques de la base de données. Readiris utilise une base de connaissances et, grâce aux informations d'apprentissage accumulées, il est capable de distinguer un prénom et un nom, une ville et son pays, un numéro de téléphone et un numéro de télécopie, etc. Les données de résultat peuvent être envoyées directement dans un logiciel de gestion des contacts tel que le Carnet d'adresses. Les données peuvent également être stockées dans un fichier structuré, au format vCard par exemple, puis importées dans une base de données d'adresses. Readiris est compatible avec Twain et Image Capture et prend en charge un large éventail de scanners à plat et à feuilles, de périphériques tout-en-un et multifonctions mais aussi d'appareils photo numériques. Readiris prend également en charge les scanners haute vitesse et exécute le traitement par lots sur des collections d'images volumineuses : l'utilisation de pages blanches permet de segmenter les lots numérisés en documents distincts et la lecture automatique 6 ReadirisTM Corporate 12 – Guide Utilisateur des codes à barres garantit une indexation efficace des documents de sortie de la reconnaissance. FAMILLE DE PRODUITS READIRIS La famille de produits Readiris se décline en plusieurs versions : Readiris Pro 12 Readiris Corporate 12 Readiris Pro 12 Asian Readiris Corporate 12 Asian Le tableau ci-dessous présente les caractéristiques des différentes versions : Readiris Pro 12 Readiris Corporate 12 Fonctionnalités de base Fonctionnalités de base 125 langues reconnues 125 langues reconnues Génération de 4 types de fichiers PDF, Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Text, DOCX, XLSX, HTML, RTF et Unicode. Unicode. Génération de sorties PDF/A Reconnaissance d'importants volumes Traitement automatisé Reconnaissance des codes à barres Reconnaissance des cartes de visite 7 Chapitre 1 – Présentation de Readiris Readiris Pro 12 Asian Readiris Corporate 12 Asian Fonctionnalités de base Fonctionnalités de base 130 langues reconnues, y compris : 130 langues reconnues, y compris : Japonais Japonais Chinois simplifié et chinois traditionnel Chinois simplifié et chinois traditionnel Coréen Coréen Hébreu Hébreu Génération de 4 types de fichiers PDF, Génération de 4 types de fichiers PDF, de fichiers PDF-iHQC, OpenDocument de fichiers PDF-iHQC, OpenDocument Text, DOCX, XLSX, HTML, RTF et Text, DOCX, XLSX, HTML, RTF et Unicode Unicode Génération de sorties PDF/A Reconnaissance d'importants volumes Traitement automatisé Reconnaissance des codes à barres Reconnaissance des cartes de visite 8 ReadirisTM Corporate 12 – Guide Utilisateur 9 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 2 INSTALLATION DE READIRIS CONFIGURATION REQUISE La configuration minimale suivante est nécessaire pour exécuter Readiris : Ordinateur Mac OS avec processeur Intel ou G3. Système d'exploitation Mac OS X 10.4 ou version ultérieure. Les versions antérieures du système d'exploitation Mac OS ne sont pas prises en charge. 220 Mo d'espace libre sur le disque. INSTALLATION DU LOGICIEL Procédure d'installation de Readiris : Ouvrez une session dans le logiciel d'exploitation de votre Mac en tant qu'utilisateur de niveau administrateur. Assurez-vous de disposer des droits d'administrateur requis pour installer le logiciel. Branchez votre scanner à votre Mac et installez le logiciel qui l'accompagne. Testez votre scanner. En cas de problème, contactez le fabricant de votre scanner. 11 Chapitre 2 – Installation de Readiris Insérez le CD-ROM de Readiris et double-cliquez sur l'icône du CD-ROM. Double-cliquez sur le programme d'installation de Readiris et suivez les instructions s'affichant à l'écran. Acceptez les conditions du contrat de licence. Le type d'installation standard est proposé. Cette option installe Readiris, Drop2Read et les échantillons d'images. Pour changer de type d'installation, cliquez sur Personnaliser. Cliquez sur Installer pour lancer l'installation. Une fois l'installation terminée, cliquez sur Terminer. Le dossier Readiris est créé automatiquement dans le dossier Applications par le programme d'installation. Les icônes Readiris et Drop2Read sont automatiquement ajoutées dans le Dock. DESINSTALLATION DU LOGICIEL Pour désinstaller Readiris : Cliquez sur Finder et ouvrez le dossier Applications. Faites glisser le dossier Readiris vers la Corbeille. Readiris est supprimé de votre ordinateur. Remarque : les préférences Readiris ne sont pas supprimées lorsque vous faites glisser le dossier Readiris vers la Corbeille, afin que vous 12 ReadirisTM Corporate 12 – Guide Utilisateur puissiez réinstaller le logiciel par la suite si vous le souhaitez. Pour supprimer les préférences, faites glisser le dossier Readiris Prefs vers la Corbeille. Ce dossier se trouve dans le chemin Utilisateurs - xxx (votre nom d'utilisateur) - Bibliothèque - Préférences. ENREGISTREMENT DU LOGICIEL Pour utiliser Readiris Corporate, vous êtes tenu de l'enregistrer. Cet enregistrement vous procurera divers avantages : Vous serez tenu informé du développement de nouveaux produits et des produits I.R.I.S. associés. Vous aurez droit à l'assistance produits. Vous bénéficierez d'offres spéciales sur les produits I.R.I.S. Pour enregistrer le logiciel : Cliquez sur Enregistrer Readiris dans le menu Aide. Vous serez redirigé sur la page Web d'enregistrement. Suivez simplement les instructions affichées à l'écran. ASSISTANCE PRODUITS Dès que vous avez enregistré votre produit, vous bénéficiez de l'assistance I.R.I.S. pour toutes les fonctionnalités de base du logiciel. Pour contacter I.R.I.S. : Europe : support.pro@irislink.com Tél. : +32 10 45 13 64 13 Chapitre 2 – Installation de Readiris Etats-Unis : support.pro@irisusa.com Tél. :+1 800 447 4744 Asie-Pacifique : support.pro@irislink.com Tél. : +852 22646133 Services d'assistance et de maintenance pour les logiciels I.R.I.S. I.R.I.S. offre également un programme d'assistance et de maintenance logicielles, qui vous permet d'obtenir les principales mises à niveau logicielles de Readiris Corporate. Pour obtenir le formulaire de demande du programme, veuillez contacter I.R.I.S. à l'adresse suivante : readiris.maintenance@irislink.com 14 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 3 MISE EN ROUTE EXECUTION DE READIRIS Pour exécuter Readiris : Cliquez sur l'icône Readiris dans le Dock. Vous pouvez également double-cliquer sur l'icône de l'application Readiris dans le dossier Readiris sous Applications. Si vous avez acheté la version Readiris Corporate, le système vous invite à enregistrer le logiciel. Cliquez sur S'enregistrer par Internet et effectuez la procédure d'enregistrement pour acquérir votre clé logicielle. Saisissez ensuite la clé logicielle reçue par e-mail dans le champ requis. L'interface Readiris s'affiche. 15 Chapitre 3 – Mise en route INTERFACE UTILISATEUR L'interface de Readiris se compose des éléments suivants : Barre d'outils principale (barre d'outils de gauche) Utilisez les commandes de la barre d'outils principale pour la numérisation et la reconnaissance manuelle des documents. Barre d'outils Image (barre d'outils de droite) Utilisez les boutons de la barre d'outils Image pour modifier des documents dans l'interface de Readiris. Pointez sur les différents boutons pour afficher leur infobulle. Barre de menus Readiris (haut de l'écran) La barre de menus Readiris contient toutes les commandes et options également présentes dans les barres d'outils principale et Image. La barre de menus Readiris vous permet en outre de définir plusieurs paramètres avancés. 16 ReadirisTM Corporate 12 – Guide Utilisateur Lorsque vous ouvrez ou numérisez un document dans Readiris, vous pouvez voir ses miniatures de page dans le tiroir à images. Cliquez sur l'icône du tiroir pour l'ouvrir. Le tiroir peut s'ouvrir tant à droite qu'à gauche de l'interface Readiris, en fonction de sa position à l'écran. Le tiroir vous permet de déplacer les pages à l'intérieur d'un document : il suffit de cliquer sur les pages à déplacer et de les faire glisser à l'endroit voulu. Il permet de marquer les pages en tant que couvertures et de modifier la langue de reconnaissance par page en appuyant sur la touche Ctrl et en cliquant sur la langue voulue. 17 Chapitre 3 – Mise en route Le tiroir vous permet de supprimer des pages en les faisant glisser vers la Corbeille dans le Dock. MODIFICATION DE LA LANGUE DE L'INTERFACE UTILISATEUR Lorsque Readiris s'ouvre, l'interface utilisateur s'affiche dans la langue actuellement sélectionnée dans vos préférences système. Pour modifier la langue de l'interface utilisateur de Readiris : Cliquez sur l'icône Préférences Système dans le Dock. Ouvrez ensuite la section International. Faites glisser la langue de votre choix en haut de la liste et fermez la fenêtre International. L'interface utilisateur de Readiris est disponible dans plusieurs langues. Redémarrez Readiris pour appliquer les nouveaux paramètres de langue. CONFIGURATION DU SCANNER DANS READIRIS Readiris prend en charge les scanners compatibles Twain 1.9 et Image Capture. 18 ReadirisTM Corporate 12 – Guide Utilisateur Cependant, pour pouvoir utiliser un scanner, ses pilotes doivent être installés sur votre Mac. Procédure : Branchez votre scanner à votre Mac et installez le logiciel et/ou les pilotes qui l'accompagnent. Testez votre scanner. En cas de problème, contactez le fabricant de votre scanner. Exécutez Readiris. Dans le menu Readiris, cliquez sur Préférences. Une fois les pilotes du scanner installés correctement, une liste des scanners pris en charge s'affiche. Sélectionnez votre modèle de scanner dans cette liste. Assurez-vous de sélectionner l'option Activer les scanners Image Capture lorsque vous utilisez un scanner Image Capture. Différentes options de scanner et de prétraitement sont disponibles. Reportez-vous à la section Numérisation des documents papier pour plus d'informations. 19 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 4 UTILISATION DE DROP2READ Drop2Read est un utilitaire simple mais néanmoins efficace qui permet la reconnaissance instantanée des documents, sans que vous n'ayez à afficher Readiris. L'utilitaire Drop2Read est installé dans le cadre de l'installation par défaut de Readiris. Pour traiter des documents : Il suffit de faire glisser vos documents vers l'icône Drop2Read dans le Dock. La fenêtre Drop2Read s'ouvre et Drop2Read traite vos documents en appliquant les paramètres par défaut. Par défaut, Drop2Read traite les documents comme des documents en anglais, les formate comme des fichiers RTF et les enregistre dans le dossier source des fichiers d'origine. 21 Chapitre 4 – Utilisation de Drop2Read Cliquez sur la liste pour modifier les paramètres. Tous les paramètres modifiés sont enregistrés lorsque vous fermez la fenêtre Drop2Read. La prochaine fois que vous voudrez traiter des documents au moyen des mêmes paramètres, il suffira de les faire glisser vers l'icône Drop2Read dans le Dock. Notez que Drop2Read utilise des paramètres de base. Utilisez Readiris si vous souhaitez appliquer des paramètres avancés lors du traitement de documents. Conseil : pour plus d'informations sur les formats de sortie disponibles, consultez la section Formatage de documents. Pour rappel, toutes les options ne s'appliquent pas à Drop2Read. 22 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 5 NUMERISATION ET OUVERTURE DE DOCUMENTS SELECTION DU TYPE DE DOCUMENT Avant de numériser des documents ou d'ouvrir des fichiers image dans Readiris Corporate, vous pouvez sélectionner le type de document. Readiris peut traiter soit des pages de texte, soit des cartes de visite. Procédure Cliquez sur l'icône Type de document dans la barre d'outils principale et sélectionnez le type de document. Selon le type de document sélectionné, plusieurs formats de sortie sont disponibles. Pour plus d'informations, consultez les sections Formatage de documents et Reconnaissance des cartes de visite. 23 Chapitre 5 – Numérisation et ouverture de documents SELECTION DES OPTIONS Avant de numériser des documents papier ou d'ouvrir des fichiers image, vous pouvez sélectionner plusieurs options d'optimisation d'images. Lorsqu'elles sont sélectionnées, ces options sont appliquées lors de l'ouverture et de la numérisation des documents. Procédure Cliquez sur le bouton Options dans la barre d'outils principale pour sélectionner diverses options d'optimisation d'images. o Cliquez sur Redressement des pages pour corriger l'angle éventuel des pages numérisées. Si vous avez oublié d'activer cette option, cliquez sur l'icône Redresser la page de la barre d'outils Image ou cliquez sur la commande correspondante du menu Action. L'image sera redressée et l'analyse de page sera executée à nouveau. o Cliquez sur Détection de l’orientation des pages pour faire pivoter les pages automatiquement afin qu'elles soient orientées correctement. Notez que ces deux options ralentissent quelque peu la numérisation. Ne les sélectionnez qu'en cas de nécessité. 24 ReadirisTM Corporate 12 – Guide Utilisateur o Cliquez sur Elimination du bruit et déplacez le curseur pour indiquer la taille des points que vous désirez supprimer des images binarisées. Les options précitées sont également disponibles dans le menu Configuration. o L'option Analyse de page est activée par défaut. De cette façon, les images numérisées ou ouvertes sont automatiquement découpées en zones. Vous pouvez également utiliser les outils de zonage de la barre d'outils Image pour modifier les résultats de l'analyse de page ou pour appliquer un zonage manuel aux documents. Pour plus d'informations, consultez la section Zonage manuel des documents. Lorsque vous avez terminé de sélectionner les options voulues, cliquez sur le bouton Numériser ou Ouvrir pour numériser les documents ou ouvrir les fichiers image. OUVERTURE DE FICHIERS IMAGE Readiris vous permet de traiter des documents papier numérisés avec votre scanner ou de traiter des fichiers image existants de différents formats. Pour ouvrir des fichiers image existants : Cliquez sur le bouton Ouvrir pour rechercher des fichiers image. Conseil : vous pouvez également faire glisser les fichiers image vers l'icône Readiris dans le Dock pour les ouvrir. 25 Chapitre 5 – Numérisation et ouverture de documents Conseil : tout en maintenant la touche Ctrl enfoncée, cliquez sur le fichier image à ouvrir, pointez ensuite sur Ouvrir avec et cliquez sur Readiris. Le logiciel Readiris s'ouvre et affiche l'image. Conseil : lorsque vous chargez des documents PDF et des fichiers image de plusieurs pages (images TIFF), vous pouvez définir l'étendue de pages (dans le cas où vous avez uniquement besoin d'un chapitre spécifique d'un document, par exemple). Readiris prend en charge les formats d'image suivants : GIF, JPEG, JPEG 2000, MacPaint, Photoshop, PICT, PNG, QuickDraw GX, QuickTime, Silicon Graphics, Targa, TIFF (non compressés ou compressés de type PackBits et Group 3), TIFF multipages, Windows Bitmap (BMP), et images de document PDF. Sélectionnez le fichier image de votre choix et cliquez sur Ouvrir. Pour effectuer un zoom avant sur l'image ouverte, utilisez la loupe de la barre d'outils Image ou appuyez sur la touche Commande et cliquez à l'intérieur de l'image. Vous pouvez également ouvrir plusieurs fichiers image simultanément : o Sélectionnez le premier fichier image puis, tout en maintenant la touche Commande enfoncée, sélectionnez les autres images. o Vous pouvez également sélectionner une plage de fichiers image contigus en sélectionnant la première image et la dernière tout en maintenant la touche Maj enfoncée. Pour indiquer la fin d'un document et le début de l'autre, insérez un fichier vide entre les deux documents et définissez les options de traitement des documents. Notez que Readiris traite les documents par ordre alphabétique. Par conséquent, le fichier vide doit nécessairement suivre le dernier fichier du document. Pour plus d'informations, consultez la section Séparation des lots de documents. 26 ReadirisTM Corporate 12 – Guide Utilisateur Si vous voulez mettre fin au processus de chargement, appuyez sur la touche Echap. Lorsque vous ouvrez plusieurs fichiers image simultanément, le tiroir s'ouvre et affiche les miniatures de page. Notez que vous pouvez également faire glisser-déposer les fichiers image du Bureau vers l'icône Readiris dans le Dock pour les ouvrir. Remarque : lorsque vous traitez d'importants volumes de fichiers image, utilisez les fonctions Traitement par lots ou Dossier surveillé. Remarque : lorsque vous cliquez sur le bouton Ouvrir de la barre d'outils principale après avoir enregistré le document actif, vous êtes invité à indiquer si vous voulez supprimer ce document. Cliquez sur Non pour ajouter les fichiers image au document généré suite à la reconnaissance ou sur Oui pour créer un nouveau document. NUMERISATION DE DOCUMENTS PAPIER Readiris vous permet de traiter des documents papier que vous pouvez numériser avec votre scanner ou de traiter des fichiers image existants de différents formats. Pour numériser des documents : Sélectionnez les paramètres du scanner. Pour y accéder, dans le menu Readiris, cliquez sur Préférences. 27 Chapitre 5 – Numérisation et ouverture de documents Assurez-vous que votre scanner est connecté à votre Mac et configuré correctement. Si ce n'est pas le cas, les paramètres du scanner s'affichent. Numériseur Sélectionnez votre modèle de scanner dans la liste. Readiris prend en charge les scanners compatibles Twain et Image Capture. Remarque : certains scanners prenant en charge à la fois les pilotes Twain et Image Capture peuvent apparaître deux fois dans la liste. Calibrer Cliquez sur le bouton Calibrer si vous devez effectuer un calibrage de votre scanner. Format Vous pouvez sélectionner le format de numérisation automatique ou un format personnalisé, pour lequel vous pouvez indiquer la hauteur et la largeur de page. Profondeur Readiris prend en charge les images noir et blanc, couleur et en niveaux de gris. 28 ReadirisTM Corporate 12 – Guide Utilisateur Résolution Sélectionnez une résolution de numérisation de 300 ppp. Si vous numérisez des cartes de visite, il est recommandé de choisir une résolution de numérisation de 400 ppp. Inverser l'image Dans certains cas, les scanners Twain affichent du texte blanc sur fond noir lors de la numérisation en noir et blanc. Pour inverser les résultats, sélectionnez l'option Inverser l'image. Remarque : cette option est disponible uniquement avec les scanners Twain. La fenêtre Préférences propose également plusieurs options de prétraitement : o Vous pouvez choisir de lisser les images en niveaux de gris et en couleurs. Cette fonction agit pendant la numérisation en lissant les différences d'intensité, de sorte que les images couleur et en niveaux de gris sont plus uniformes. En conséquence, le contraste est plus marqué entre l'avant-plan (texte) et l'arrière-plan (illustration). Le lissage représente parfois la seule solution pour distinguer le texte d'un arrière-plan coloré. Remarque : cette fonction n'agit pas de la même façon que celle figurant dans les options Ajuster l'image accessible via le menu Action. o Sélectionnez Traiter comme 300 ppp lorsque vous traitez des images dont la résolution n'est pas correcte ou connue. Les images seront traitées comme si elles possédaient une résolution de 300 ppp. La plupart du temps, la résolution des photos numériques est inconnue. 29 Chapitre 5 – Numérisation et ouverture de documents o Sélectionnez Appareil photo numérique numérique lorsque vous utilisez un appareil photo numérique comme source de numérisation. Readiris fait appel à des routines de reconnaissance spéciales pour traiter les images obtenues au moyen d'un appareil photo numérique. Readiris prend en charge les appareils photo Sony, HP, Canon, Casio et Fuji comme sources de numérisation. Notez toutefois que vous pouvez charger des photos TIFF et JPEG existantes provenant de tous types d'appareils photo. Conseils en cas d'utilisation d'un appareil photo numérique comme source de numérisation : Calibrez l'appareil en prenant une photo d'un document de couleur blanche. Sélectionnez toujours la résolution d'image la plus élevée. Activez le mode macro de l'appareil afin de faire un gros plan. Utilisez uniquement le zoom optique et non numérique. Placez l'appareil photo directement au-dessus du document. Evitez de photographier ce dernier sous un angle quelconque. Prenez des photos stables. Le cas échéant, utilisez un pied. Désactivez le flash si vous photographiez un papier brillant. Evitez d'ouvrir les photos compressées. Adaptez les paramètres de contraste et de luminosité de Readiris à l'environnement (lumière du jour, artificielle, néon). Sélectionnez couleur ou niveaux de gris comme mode couleur. Une fois les paramètres définis, cliquez sur OK. 30 ReadirisTM Corporate 12 – Guide Utilisateur Cliquez ensuite sur le bouton Numériser pour numériser les documents. Remarque : faites attention au désalignement. Un désalignement supérieur à 0,5 augmente le risque d'erreurs de reconnaissance OCR. 31 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 6 OPTIMISATION DES DOCUMENTS NUMERISES Pendant la reconnaissance, Readiris convertit les images en couleurs et en niveaux de gris en images en noir et blanc binarisées, puis leur applique la reconnaissance OCR. Lorsque vous ouvrez ou numérisez des images en couleurs ou en niveaux de gris très claires ou très foncées, il est parfois nécessaire d'optimiser leurs équivalents binarisés avant de procéder à leur reconnaissance afin d'obtenir des résultats OCR satisfaisants. Pour optimiser les images : Ouvrez ou numérisez un document couleur ou en niveaux de gris. Vérifiez que les paramètres du scanner sont corrects. Dans le menu Action, cliquez sur Ajuster l'image. Vous pouvez également cliquer sur l'icône correspondante dans la barre d'outils Image. Readiris utilise des routines de binarisation intelligentes pour convertir les images couleur ou en niveaux de gris en images en noir et blanc, utilisées pour la reconnaissance OCR. o Sélectionnez Lisser les images en niveaux de gris et en couleurs pour obtenir une image plus homogène. 33 Chapitre 6 – Optimisation des documents numérisés Grâce à cette option, qui lisse les différences d'intensité, les images en couleurs et en niveaux de gris sont plus uniformes. En conséquence, le contraste est plus marqué entre l'avant-plan (texte) et l'arrière-plan (illustration). Remarque : cette option semble équivalente à celle du menu Préférences mais elle est appliquée au cours d'une phase différente du processus de reconnaissance. Remarque : le lissage représente parfois la seule manière de distinguer le texte d'un arrière-plan coloré. (Image d'origine) (Image en noir et blanc binarisée) (Image lissée) o Utilisez le curseur pour augmenter ou diminuer la valeur de luminosité. Les paramètres de luminosité déterminent la luminosité globale de l'image. Utilisez-les pour foncer ou éclaircir l'image lorsque le texte est illisible. Exemple 1 : éclaircir une image sombre afin d'éliminer l'arrière-plan de la page. 34 ReadirisTM Corporate 12 – Guide Utilisateur (Image couleur) (Image numérisée. Les paramètres de binarisation par défaut génèrent une image noire.) (L'image éclaircie donne des résultats de reconnaissance satisfaisants.) Exemple 2 : foncer une image lorsque le texte est tellement clair qu'il n'apparaît pas dans l'image binarisée. (Image couleur) (Image numérisée. Les paramètres de binarisation par défaut génèrent des caractères fragmentés.) 35 Chapitre 6 – Optimisation des documents numérisés (L'image plus foncée donne des résultats de reconnaissance satisfaisants.) o Utilisez le curseur pour augmenter ou diminuer la valeur de contraste. Les paramètres de contraste déterminent le contraste entre les zones plus claires et plus foncées d'une image. Utilisez-les pour faire ressortir les formes des caractères dans un arrière-plan coloré. (Image couleur) (Les paramètres de contraste par défaut génèrent des caractères fragmentés.) (Des paramètres de contraste plus élevés donnent des résultats de reconnaissance satisfaisants.) o Utilisez le curseur pour augmenter ou diminuer les valeurs des options Eliminer le bruit. L'élimination du bruit permet d'enlever des petites taches dans les images en noir et blanc. 36 ReadirisTM Corporate 12 – Guide Utilisateur Remarque : cette fonction d'élimination du bruit n'est pas la même que celles du menu Configuration et de la barre d'outils principale (sous Options) ; elle s'applique aux images binarisées tandis que les deux autres sont appliquées pendant la numérisation. Cliquez sur Appliquer pour afficher un aperçu des résultats. Si les résultats sont satisfaisants, cliquez sur OK pour enregistrer les paramètres et quitter. Dans le cas contraire, cliquez sur Annuler et modifiez à nouveau les paramètres. Cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance du document. Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier. Il est également possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier. 37 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 7 ZONAGE DES DOCUMENTS ZONAGE AUTOMATIQUE DES DOCUMENTS Lorsque vous numérisez ou ouvrez des documents, Readiris exécute automatiquement la fonction Analyse de page pour fractionner les documents en plusieurs zones. L'option Analyse de page est activée par défaut. Cliquez sur le bouton Options et désactivez Analyse de page si vous souhaitez éviter l'analyse de page automatique. Les résultats de l'analyse de page peuvent être modifiés manuellement après l'analyse de page automatique. Pour plus d'informations, consultez la section Zonage manuel des documents. Les résultats de l'analyse de page peuvent également être enregistrés dans un fichier de zonage, que vous pouvez réutiliser en tant que modèle de zonage chaque fois que vous numériser des documents présentant une mise en page similaire. Pour plus d'informations, consultez la section Utilisation des modèles de zonage. 39 Chapitre 7 – Zonage des documents Types de zones Readiris utilise cinq types de zones : zones de texte, zones d'image, zones de tableau, zones de code à barres et zones de texte manuscrit. L'analyse de page détecte automatiquement les zones de texte, d'image, de tableau et de code à barres. Les zones de texte manuscrit doivent être tracées manuellement. Pour plus d'informations, consultez la section Zonage manuel des documents. Chaque type de zone possède sa propre icône : Les zones sont triées de haut en bas et de gauche à droite. Des numéros indiquent l'ordre de tri des zones. Il est toutefois possible de modifier l'ordre de tri et les types de zones. Pour plus d'informations, consultez la section Zonage manuel des documents. Ne pas détecter les zones sur les bords Lorsque votre scanner génère des bordures noires autour de l'image, l'analyse de page a tendance à détecter des zones là où il n'y a que du bruit. Pour empêcher ce type de détection, cliquez sur Ne pas détecter les zones sur les bords dans le menu Zones et renumérisez le document. Encadrer une région à analyser En guise d'alternative au zonage automatique des documents, il est possible d'utiliser la fonction Encadrer une région à analyser. Cette fonction est utile lorsque la reconnaissance OCR ne doit 40 ReadirisTM Corporate 12 – Guide Utilisateur s'appliquer qu'à une seule zone spécifique dans les pages du document. Sélectionnez Encadrer une région à analyser en cliquant sur le bouton correspondant dans la barre d'outils Image. Dessinez un cadre autour de la partie de la page à laquelle Readiris doit appliquer la reconnaissance. Cliquez ensuite sur Reconnaître + Enregistrer. Vous êtes invité à indiquer si vous voulez appliquer la même zone de reconnaissance à toutes les pages du document actif. ZONAGE MANUEL DES DOCUMENTS En plus du zonage automatique des documents réalisé à l'aide de l'analyse de page, Readiris permet d'appliquer un zonage manuel aux documents. Le zonage manuel est pratique lorsque vous devez modifier les résultats de l'analyse de page automatique. Il permet également de créer des modèles de zonage. Pour plus d'informations sur les modèles, consultez la section Utilisation des modèles de zonage. Notez que les zones de texte manuscrit doivent toujours faire l'objet d'un zonage manuel. Procédure Pour appliquer un zonage manuel à un document, commencez par cliquer sur le bouton Options puis désactivez Analyse de page. 41 Chapitre 7 – Zonage des documents Ouvrez ou numérisez le document en cliquant sur le bouton Numériser ou Ouvrir. Sélectionnez le type des zones que vous souhaitez définir : cliquez sur l'icône représentant un pointeur dans la barre d'outils de droite et sélectionnez le type de zone voulu. Readiris utilise cinq types de zones : zones de texte, zones d'image, zones de tableau, zones de code à barres et zones de texte manuscrit. Dessinez un cadre autour des zones à analyser. Pour plus d'informations sur la reconnaissance des codes à barres et du texte manuscrit, consultez les sections Reconnaissance des codes à barres et Reconnaissance de texte manuscrit. Pour sélectionner d'autres types de zones, cliquez sur l'icône du type de zone actuellement sélectionné, puis choisissez le type de zone voulu. Vous pouvez également cliquer sur le menu Zones, puis pointer sur Mode interactif et sélectionner la zone à définir. 42 ReadirisTM Corporate 12 – Guide Utilisateur Lorsque la définition des zones de reconnaissance est terminée, cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance OCR. Tri des zones Pour modifier l'ordre de tri des zones, cliquez sur le bouton Trier dans la barre d'outils Image et cliquez successivement sur les différentes zones dans l'ordre voulu. Vous pouvez également cliquer sur le menu Zones puis sur Trier les zones. Pour terminer le tri, cliquez à l'extérieur d'une zone. Une fois terminé, cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance. Les zones non sélectionnées sont exclues de la reconnaissance. Dessin de polygones Le zonage manuel de documents n'est pas limité à des formes rectangulaires. Vous pouvez créer des zones polygonales en fusionnant des zones rectangulaires. Chaque fois que deux zones du même type se touchent, elles forment automatiquement un polygone. 43 Chapitre 7 – Zonage des documents Analyse de page automatique Si la page active est trop complexe pour un zonage manuel, cliquez sur le bouton Analyser la page dans la barre d'outils Image afin de réaliser un zonage automatique de la page. Notez que les zones de texte manuscrit et de code à barres doivent toujours être délimitées manuellement. Modification du type de zone Pour modifier le type de zone, appuyez sur la touche Ctrl et cliquez sur la zone puis sélectionnez le type de zone requis. Vous pouvez également changer simultanément le type de plusieurs zones : 44 ReadirisTM Corporate 12 – Guide Utilisateur Cliquez sur l'icône représentant un pointeur dans la barre d'outils Image, puis cliquez sur Sélectionner des zones. Conseil : si l'icône représentant un pointeur n'est pas visible dans la barre d'outils Image, cela signifie que l'un des cinq types de zones est actuellement sélectionné. Cliquez sur les icônes correspondantes dans la barre d'outils, puis cliquez sur Sélectionner des zones. Tout en maintenant la touche Maj enfoncée, sélectionnez plusieurs zones. Dans le menu Zones, pointez sur Type de zone et cliquez sur le type de zone souhaité. Modification de la taille d'une zone Cliquez dans la zone à modifier. Placez le pointeur de la souris sur un marqueur (sur les côtés et dans les angles de la zone). Cliquez sur le marqueur et faites glisser le pointeur de la souris afin de modifier la taille de la zone. Déplacement de zones Sélectionnez la zone à déplacer. 45 Chapitre 7 – Zonage des documents Cliquez à l'intérieur de la zone et faites glisser le pointeur de la souris afin de modifier la position de la zone. Reconnaissance d'une zone spécifique Appuyez sur la touche Ctrl et cliquez sur la zone auxquelles appliquer la reconnaissance, puis sélectionnez Copier le texte. Les résultats sont envoyés au Presse-papiers en tant que texte continu. Cette commande fonctionne également pour le texte manuscrit. Il est également possible de copier les zones d'image et les zones de code à barres dans le Presse-papiers. Reconnaissance de toutes les zones de texte Pour soumettre toutes les zones de texte d'une page à la reconnaissance, cliquez sur la commande Copier les zones de texte dans le menu Zones. Ces zones sont copiées dans le Presse-papiers. Reconnaissance de toutes les zones d'image Pour soumettre tre toutes les zones d'image d'une page à la reconnaissance, cliquez sur la commande Copier les zones d'image dans le menu Zones. Ces zones sont copiées dans le Presse-papiers. Suppression de zones Sélectionnez la ou les zones à supprimer ou cliquez sur la commande Supprimer toutes les zones dans le menu Zones. Sélectionnez les commandes Couper ou Effacer dans le menu Edition pour couper ou supprimer les zones. 46 ReadirisTM Corporate 12 – Guide Utilisateur Suppression de petites zones Certains documents, les télécopies par exemple, comportent des points « dispersés » sur les pages, ce qui conduit Readiris à créer des zones inutiles qui ne contiennent pas de texte. Pour effacer toutes ces zones de petite taille, cliquez sur Supprimer les petites zones dans le menu Zones. Cette option efface toutes les zones de taille inférieure à 0,5" et retrie les zones restantes. UTILISATION DES MODELES DE ZONAGE Lorsque vous effectuez une reconnaissance d'un grand nombre de documents présentant une mise en page similaire, il peut être utile d'avoir recours aux modèles de zonage plutôt qu'à l'analyse de page. De cette façon, la même structure de zones est appliquée à tous les documents numérisés ou ouverts, ce qui permet d'accélérer le processus. Procédure Cliquez sur Options dans la barre d'outils principale et désactivez Analyse de page. Ouvrez votre document et procédez au zonage manuel de la première page du document à l'aide des boutons de la barre d'outils Image. Pour plus d'informations, consultez la section Zonage manuel des documents. Dans le menu Zones, cliquez sur la commande Enregistrer. 47 Chapitre 7 – Zonage des documents Ouvrez ou numérisez les autres pages du document en cliquant sur le bouton Numériser ou Ouvrir dans la barre d'outils principale. Les zones sont appliquées aux documents ouverts ou numérisés. Si vous souhaitez appliquer le même modèle de zonage la prochaine fois que vous utilisez Readiris, cliquez sur la commande Ouvrir dans le menu Zones. Encadrer une région à analyser En guise d'alternative aux modèles de zonage, il est possible d'utiliser la fonction Encadrer une région à analyser. Celle-ci vous permet de définir la zone spécifique de la page devant faire l'objet de la reconnaissance. Toutes les données à l'extérieur de la zone d'OCR sont exclues de la reconnaissance. Procédure Sélectionnez Encadrer une région à analyser en cliquant sur le bouton correspondant dans la barre d'outils Image. Dessinez un cadre autour de la partie de la page à laquelle Readiris doit appliquer la reconnaissance. Vous êtes invité à indiquer si vous voulez appliquer la même zone de reconnaissance à toutes les pages du document actif. Pour annuler cette fonction, réexécutez l'analyse de page en cliquant sur le bouton Analyser la page dans la barre d'outils Image. Cliquez sur Reconnaître + Enregistrer pour exécuter l'OCR. 48 ReadirisTM Corporate 12 – Guide Utilisateur Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier. Il est possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier. 49 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 8 RECONNAISSANCE DES DOCUMENTS INTRODUCTION Pour la reconnaissance des documents, Readiris applique une analyse linguistique au cours de l'étape de reconnaissance. Cette méthode lui permet d'effectuer la reconnaissance du texte, des tableaux, des images, des codes à barres et du texte manuscrit dans tous les types de documents. Readiris traite même les documents disposés en colonnes complexes ou de piètre qualité, les télécopies, les impressions matricielles, les documents mal numérisés ou copiés contenant des caractères trop clairs ou trop foncés, etc. Readiris prend en charge 125 langues : toutes les langues d'Amérique et d'Europe, y compris les langues d'Europe centrale, les langues baltes, le grec, le turc et le cyrillique. Grâce à des modules complémentaires en option, Readiris est capable de lire des documents en hébreu et dans quatre langues asiatiques, à savoir le japonais, le coréen, le chinois simplifié et le chinois traditionnel. Readiris peut même traiter les documents combinant des alphabets différents : le logiciel détecte les mots « occidentaux » qui ressortent des documents en grec, en cyrillique, en langue asiatique et en hébreu puisque bon nombre de noms propres intranscriptibles, de noms de marques, etc. sont écrits à l'aide des symboles occidentaux. Readiris repose sur les technologies de reconnaissance les plus évoluées. La reconnaissance du texte indépendante de la police est 49 Chapitre 8 – Reconnaissance des documents complétée par des techniques d'auto-apprentissage. Le système est capable d'apprendre de nouveaux mots et caractères grâce à une analyse contextuelle et linguistique. En d'autres termes, la précision de l'OCR s'améliore avec le temps et l'utilisation. En outre, Readiris offre une fonction de vérification utilisateur. Lorsqu'elle est activée, la fonction de vérification utilisateur (apprentissage interactif) marque les caractères considérés comme douteux par le système de reconnaissance et permet également d'améliorer la précision de la reconnaissance. Toutes les solutions que vous validez sont enregistrées temporairement dans la mémoire du système, ce qui non seulement le rend plus rapide et plus fiable au fil du temps mais également plus intelligent. Ce puissant outil d'apprentissage interactif permet également à Readiris de reconnaître des caractères spéciaux, notamment les symboles mathématiques et les signes typographiques, et de traiter les polices déformées. Les résultats de l'apprentissage interactif peuvent être enregistrés de façon permanente dans des dictionnaires de polices pour utilisation ultérieure. Une autre méthode pour améliorer la précision de la reconnaissance consiste à recourir aux lexiques utilisateur. Vous pouvez créer des lexiques utilisateur spécialisés contenant la terminologie spécifique que Readiris doit pouvoir reconnaître dans vos documents. SELECTION DE LA LANGUE DU DOCUMENT Readiris offre des fonctionnalités d'OCR dans 125 langues. Il prend en charge toutes les langues d’Amérique et d’Europe, y compris les langues d’Europe centrale, les langues baltes, le grec, le turc et le cyrillique. 52 ReadirisTM Corporate 12 – Guide Utilisateur Readiris Pro Asian et Readiris Corporate Asian permettent en outre la reconnaissance des documents en japonais, en chinois simplifié et traditionnel ainsi qu'en coréen. Pour que Readiris puisse exécuter la reconnaissance d'un document, vous devez préciser sa langue. Pour ce faire, procédez comme suit : Cliquez sur l'icône représentant un globe dans la barre d'outils principale et sélectionnez la langue de votre choix dans la liste déroulante. Important : sélectionnez la langue du document avant d'exécuter l'analyse de page lorsqu'il s'agit de documents asiatiques, hébreux ou arabes. Des routines d'analyse de page spécifiques sont utilisées pour ces documents. La reconnaissance peut également être limitée à un jeu de caractères numérique pour optimiser la reconnaissance des tableaux et des chiffres. Readiris reconnaît alors uniquement les chiffres entre 0 et 9 ainsi que les symboles suivants : 53 Chapitre 8 – Reconnaissance des documents + signe plus * astérisque / barre oblique % pourcentage , virgule . point ( parenthèse d'ouverture £ livre sterling ) parenthèse de fermeture € euro tiret = signe égal $ dollar ¥ yen Pour activer le mode numérique, sélectionnez Numérique dans la boîte de dialogue Langue. Reconnaissance de documents multilingues Readiris permet également d'activer la reconnaissance de jeux de caractères mixtes. De cette façon, Readiris change automatiquement de langue en milieu de phrase et reconnaît les mots anglais (noms propres, etc.) conservés dans des langues dites "exotiques". Cliquez sur le bouton représentant un globe dans la barre d'outils principale et sélectionnez la combinaison de langues de votre choix dans la liste déroulante. Remarque : lors du traitement de documents en arabe ou en hébreu, les jeux de caractères mixtes sont automatiquement utilisés. Reconnaissance des langues secondaires Outre la langue, ou combinaison de langues, principale, Readiris vous permet de sélectionner jusqu'à 4 langues secondaires du même groupe de langues. Cette option est utile lors de la reconnaissance de documents multilingues. En fonction de la langue principale sélectionnée, Readiris affiche une liste des langues secondaires disponibles. 54 ReadirisTM Corporate 12 – Guide Utilisateur Remarque : ne sélectionnez pas de langues inutiles. En effet, plus le jeu de caractères est volumineux, plus la reconnaissance est lente et le risque d'erreurs d'OCR élevé. Sélection de la langue par page Si certaines pages utilisent une autre langue que la totalité du document, il n'est pas nécessaire de définir une langue secondaire. Il est possible d'appliquer une langue différente à ces pages. Sélectionnez la ou les pages en question dans le tiroir, cliquez dessus tout en maintenant la touche Ctrl enfoncée, puis utilisez la commande Langue pour leur affecter une autre langue que la langue du document. Les pages dont la langue est différente de celle de la langue du document sont marquées en rouge dans le tiroir. Cela fonctionne également pour la reconnaissance des cartes de visite. 55 Chapitre 8 – Reconnaissance des documents Contrairement aux langues secondaires, aucune limitation ne s'applique dans ce cas. Remarque : une infobulle accompagne chaque page dans le tiroir pour indiquer la langue qui lui est appliquée. UTILISATION DES LEXIQUES UTILISATEUR Au cours du processus de reconnaissance, Readiris se sert de bases de données linguistiques pour une reconnaissance optimale du texte. Disponibles pour chaque langue prise en charge, ces bases de données linguistiques sont des lexiques standard. Ces lexiques standard, bien que puissants et très complets, peuvent être complétés par des lexiques utilisateur personnalisés afin d'optimiser la précision de la reconnaissance des caractères. Ces lexiques utilisateur permettent à Readiris de reconnaître des termes techniques, scientifiques, juridiques ou propres à la société qui lui poseraient normalement problème. 56 ReadirisTM Corporate 12 – Guide Utilisateur Dans le menu Configuration, cliquez sur Lexique utilisateur. Cliquez sur Edition pour ouvrir l'application User Lexicon Editor. Vous pouvez également accéder à l'éditeur User Lexicon Editor au départ du dossier d'installation Readiris. Dans le menu Fichier, cliquez sur Nouveau pour ouvrir un nouveau lexique. Indiquez les mots que Readiris doit reconnaître et cliquez sur le bouton Ajouter. Vous pouvez également copier-coller des segments de texte d'autres fichiers ou encore importer et modifier des fichiers texte existants. Conseil : l'importation de documents d'entreprise ou de listes de mots offre le moyen le plus rapide de créer un lexique utilisateur des termes spécifiques à la société. Les mots ou expressions ajoutés sont triés par ordre alphabétique. Les doublons sont automatiquement rejetés. Cliquez sur Enregistrer pour enregistrer le fichier de lexique dans le dossier de votre choix. Revenez dans le menu Configuration et pointez sur Lexique utilisateur. Cliquez sur Ouvrir et sélectionnez le fichier de lexique utilisateur de votre choix dans la boîte de dialogue. Remarque : pour que Readiris puisse reconnaître les mots du lexique utilisateur, vous devez avoir sélectionné la langue correcte. Pour ce 57 Chapitre 8 – Reconnaissance des documents faire, cliquez sur l'icône représentant un globe dans la barre d'outils principale. Les mots contenant des caractères qui n'existent pas dans la langue sélectionnée ne seront pas reconnus correctement. Cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance. Règles syntaxiques Plusieurs règles syntaxiques sont appliquées lors de l'insertion de nouveaux termes : La casse est préservée. Exemple : IRISCard reste IRISCard. Tous les signes de ponctuation et les caractères spéciaux au début et à la fin des mots sont automatiquement filtrés. Les tirets des mots composés sont conservés. Exemple : Notre-Dame de Paris reste Notre-Dame de Paris. Conseil : vérifiez les césures en fin de ligne lorsque vous importez des fichiers texte ou copiez-collez des mots couvrant deux lignes. Les nombres ne sont pas acceptés. En revanche, les chiffres présents au sein des noms de produits sont conservés. Exemple : FAT32 reste FAT32. Systolic 150 devient Systolic. 58 ReadirisTM Corporate 12 – Guide Utilisateur DEFINITION DES CARACTERISTIQUES DU DOCUMENT Outre la langue du document, d'autres caractéristiques de document, le type de police et l'espacement des caractères, jouent notamment un rôle important dans le processus de reconnaissance. Type de police Readiris distingue les documents dits « normaux » et les documents d'impression matricielle. Les symboles matriciels (du type 9 aiguilles) sont composés de points distincts. Des techniques de segmentation et de reconnaissance spéciales sont nécessaires pour la reconnaissance des documents d'impression matricielle et doivent être activées. Pour sélectionner le type de police : Dans le menu Configuration, pointez sur Type de police. Par défaut, le type de police a la valeur Automatique. De cette façon, Readiris reconnaît les impressions matricielles « 25 aiguilles » ou « NLQ » (qualité quasi-courrier) ou d'autres types d'impression « normale ». Pour que la reconnaissance s'applique uniquement aux documents d'impression matricielle, cliquez sur Matricielle. Readiris appliquera la reconnaissance aux documents d'impression matricielle de qualité « brouillon » ou à « 9 aiguilles ». 59 Chapitre 8 – Reconnaissance des documents Espacement des caractères L'espacement des caractères est le nombre de caractères par pouce dans un type de caractère. L'espacement des caractères peut être fixe, auquel cas tous les caractères ont la même largeur, ou proportionnel, auquel cas leur largeur est différente. Pour sélectionner l'espacement des caractères : Dans le menu Configuration, pointez sur Espacement des caractères. Par défaut, l'espacement a la valeur Automatique. Cliquez sur Fixe si tous les caractères ont la même largeur. C'est souvent le cas dans les documents dactylographiés avec d'anciennes machines à écrire. Cliquez sur Proportionnel si les caractères ont une largeur différente. La vaste majorité des polices utilisées dans les journaux, magazines et livres est proportionnelle. Important : ces caractéristiques de document ne s'appliquent pas aux documents en langue asiatique, arabe ou hébreu. UTILISATION DE L'APPRENTISSAGE INTERACTIF Readiris propose une fonction d'apprentissage interactif. Grâce à l'apprentissage interactif, vous pouvez « former » le système à la reconnaissance des polices et des formes des caractères et, le cas échéant, corriger les résultats de l'OCR. Lors de cette phase 60 ReadirisTM Corporate 12 – Guide Utilisateur d'apprentissage interactif, tous les caractères non formellement reconnus par le système sont affichés dans une fenêtre d'aperçu, accompagnés de leur mot parent et de la solution proposée. Cet apprentissage peut sensiblement améliorer la précision du système de reconnaissance et est particulièrement utile pour la reconnaissance des caractères dégradés et déformés. Il permet également d'apprendre à Readiris à reconnaître les symboles spéciaux qu'il n'arrive pas à identifier de prime abord, notamment les symboles mathématiques et scientifiques ainsi que les signes typographiques. Pour activer l'apprentissage interactif : Dans le menu Apprentissage, cliquez sur Apprentissage interactif. Cliquez sur le bouton Reconnaître + Enregistrer pour effectuer la reconnaissance du document. Readiris passe en phase d'apprentissage interactif. Les caractères jugés douteux par le système de reconnaissance sont affichés. 61 Chapitre 8 – Reconnaissance des documents Si les résultats sont corrects : o Cliquez sur le bouton Apprendre pour enregistrer les résultats confirmés. Les résultats de l'apprentissage sont stockés temporairement dans la mémoire de l'ordinateur pour la durée de la reconnaissance. Readiris n'affiche plus les caractères préalablement « appris » lorsqu'il effectue la reconnaissance du reste du document. Lorsqu'un nouveau document fait l'objet d'une reconnaissance, les résultats de l'apprentissage sont effacés. Pour enregistrer définitivement les résultats de l'apprentissage, utilisez un dictionnaire de polices. Pour plus d'informations, consultez la rubrique Utilisation des dictionnaires de polices. o Cliquez sur Finir pour enregistrer toutes les solutions proposées par le logiciel. Si les résultats ne sont pas corrects : o Entrez les caractères corrects et cliquez sur le bouton Apprendre. Remarque : lorsque vos documents contiennent des caractères spéciaux, veillez à cliquer sur la commande Caractères spéciaux du menu Edition. Double-cliquez sur le caractère à insérer. 62 ReadirisTM Corporate 12 – Guide Utilisateur ou o Cliquez sur le bouton Ne pas apprendre pour enregistrer les résultats comme étant douteux. Utilisez cette commande pour les caractères endommagés qui pourraient être confondus avec d'autres caractères s'ils étaient enregistrés comme étant confirmés, par exemple, le nombre 1 et la lettre I, qui présentent une forme identique dans de nombreuses polices. o Cliquez sur Supprimer pour supprimer les caractères de la sortie. Utilisez ce bouton pour éviter que des caractères parasites (bruit) n'apparaissent dans le fichier de sortie. o Cliquez sur Annuler pour corriger des erreurs. Readiris peut assurer le suivi des 32 dernières opérations. o Cliquez sur Interrompre pour interrompre l'apprentissage interactif. 63 Chapitre 8 – Reconnaissance des documents Tous les résultats de l'apprentissage seront supprimés. La prochaine fois que vous cliquez sur Reconnaître + Enregistrer, l'apprentissage interactif est réexécuté. UTILISATION DES DICTIONNAIRES DE POLICES Lorsque vous numérisez de nombreux documents de mêmes type, qualité de police et qualité d'impression, vous souhaitez parfois éviter de répéter le processus d'apprentissage. Dans un tel cas, l'emploi de dictionnaires de polices s'avère utile. Les dictionnaires de polices contiennent des informations sur les polices assimilées par le programme lors de l'apprentissage interactif et peuvent améliorer sensiblement les résultats de la reconnaissance. Notez que les dictionnaires de polices sont limités à 500 formes. Il est recommandé de créer des dictionnaires distincts pour des applications spécifiques. Pour créer un nouveau dictionnaire de polices : Dans le menu Apprentissage, cliquez sur la commande Nouveau dictionnaire. Cliquez sur Apprentissage interactif dans le menu Apprentissage pour l'activer. Cliquez sur Reconnaître + Enregistrer pour effectuer la reconnaissance du document. Readiris passe en phase d'apprentissage interactif. Utilisez les boutons de la boîte de dialogue pour enregistrer les caractères dans le dictionnaire de polices. Une fois la reconnaissance terminée, cliquez sur Enregistrer pour enregistrer le document. 64 ReadirisTM Corporate 12 – Guide Utilisateur Revenez au menu Apprentissage et cliquez sur Enregistrer le dictionnaire. Saisissez le nom du dictionnaire et cliquez sur Enregistrer. Pour utiliser un dictionnaire de polices existant : Dans le menu Apprentissage, cliquez sur Ouvrir un dictionnaire. Sélectionnez le dictionnaire de votre choix et cliquez sur Ouvrir. Cliquez sur Reconnaître + Enregistrer pour effectuer la reconnaissance du document. 65 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 9 FORMATAGE ET ENREGISTREMENT DE DOCUMENTS FORMATAGE DE DOCUMENTS Readiris permet, une fois la reconnaissance effectuée, d'enregistrer vos documents dans de nombreux formats de sortie : Readiris vous permet de générer plusieurs types de documents texte, à savoir OpenDocument Text, Open XML (docx), RTF et Unicode. Il convient de noter que la dernière version de Microsoft Word (2008) est indispensable pour ouvrir les fichiers .docx. L'ouverture des fichiers .docx dans Microsoft Word 2004 nécessite le téléchargement d'un convertisseur docx. Ce dernier peut être téléchargé à partir du site Web de Microsoft. Les versions antérieures de Microsoft Word ne prennent pas en charge les fichiers .docx. Vous pouvez générer des données tabulaires au format de programmes tableur (Open XML de type .xlsx), applications de traitement de texte (RTF) et navigateurs web (HTML) : les tableaux sont reconstitués cellule par cellule dans des feuilles de calcul et insérés en tant qu'objets tableau dans des fichiers de traitement de texte. Readiris reconnaît les tableaux avec et sans grille. Notez en outre que la dernière version de Microsoft Excel (2007) est nécessaire pour ouvrir les fichiers .xlsx. L'ouverture des fichiers .xlsx dans Microsoft Excel 2004 nécessite le téléchargement d'un 67 Chapitre 9 – Formatage et enregistrement de documents convertisseur xlsx. Ce dernier peut être téléchargé à partir du site Web de Microsoft. Les versions antérieures de Microsoft Excel ne prennent pas en charge les fichiers .xlsx. (avec grille) (sans grille) Readiris propose quatre types de sorties PDF. Pour plus d'informations, consultez la section Création de documents PDF. Readiris vous permet d'enregistrer vos documents sous la forme de fichiers image sans leur appliquer la reconnaissance. Readiris offre la possibilité d'enregistrer les documents en tant qu'images JPEG, JPEG 2000, Photoshop, PICT, PNG, TIFF et bitmap Windows. Procédure Cliquez sur l'icône Format de sortie de la barre d'outils principale. Sélectionnez le format de sortie souhaité dans la liste Format. Les applications et formats de sortie disponibles varient selon que vous avez sélectionné Texte ou Cartes de visite comme type de document. 68 ReadirisTM Corporate 12 – Guide Utilisateur Pour plus d'informations sur la reconnaissance des cartes de visite, consultez la section Reconnaissance des cartes de visite. En fonction du format sélectionné, différentes options de mise en page et d'image sont disponibles. Les options de mise en page et d'image sont traitées dans les sections Sélection des options de mise en page et Sélection des options d'image. Les options indisponibles pour le format de sortie sélectionné sont affichées en grisé. Il est également possible d'envoyer les documents de sortie de la reconnaissance directement vers une application cible, laquelle s'ouvrira automatiquement. Readiris permet d'envoyer les sorties vers les principales suites bureautiques, les principaux tableurs et applications de traitement de texte, tels que Microsoft Word et Excel (Mac Office), AppleWorks et Apple Pages, les navigateurs Web les plus répandus, comme Apple Safari, vers Adobe Acrobat et Adobe Reader, Aperçu et des éditeurs de texte simple tel TextEdit. Selon le format de sortie sélectionné dans la liste Format, Readiris propose l'application par défaut utilisée dans votre système pour l'ouverture du type de fichier en question. Pour choisir une autre application, cliquez sur le bouton Choisir en regard de la liste Envoyer vers et recherchez l'application voulue. Si vous voulez simplement enregistrer vos documents sans les ouvrir, sélectionnez Aucun dans la liste Envoyer vers. Conseil : vous pouvez sélectionner votre application de messagerie par défaut en tant qu'application cible. De cette façon, Readiris ouvrira un nouvel e-mail lorsque vous cliquerez sur Reconnaître + Enregistrer et ajoutera le document généré suite à la reconnaissance sous la forme de pièce jointe. Cliquez ensuite sur OK pour enregistrer les paramètres puis sur Reconnaître + Enregistrer dans la barre d'outils principale. 69 Chapitre 9 – Formatage et enregistrement de documents Vous pouvez également utiliser la commande Enregistrer le document du menu Fichier. Il est également possible d'enregistrer une sélection de pages en cliquant sur Enregistrer les pages sélectionnées dans le menu Fichier. Les résultats de l'OCR peuvent être exportés à plusieurs reprises sans devoir répéter la procédure de reconnaissance. Cliquez de nouveau sur le bouton Format de sortie et modifiez le format du texte ainsi que les options de formatage. Après quoi, cliquez à nouveau sur Reconnaître + Enregistrer ou sur Enregistrer le document. SELECTION DES OPTIONS DE MISE EN PAGE Selon le format de sortie sélectionné, plusieurs options de mise en page sont disponibles. Pour accéder aux options de mise en page : Cliquez sur l'icône Format de sortie de la barre d'outils principale. Sélectionnez le format de sortie souhaité dans la liste Format. Les options de mise en page disponibles pour le format sélectionné s'affichent : Les options non disponibles s'affichent en grisé. o L'option Créer du texte continu empêche Readiris d'appliquer un formatage au texte. Readiris génère un texte continu. 70 ReadirisTM Corporate 12 – Guide Utilisateur o L'option Retenir le formatage des mots et des paragraphes représente une solution intermédiaire entre la génération d'un texte continu et le formatage automatique. Le type de police, la taille et le type de caractère sont préservés lors de la reconnaissance. Les tabulations et l'alignement de chaque bloc sont recréés. Les colonnes et les blocs de texte ne sont pas recréés, les paragraphes se suivent simplement. Les tableaux sont reproduits correctement. o L'option Recréer le document d'origine permet de générer un facsimilé du document d'origine. Readiris génère une copie fidèle du document d'origine qui n'est plus une image numérisée. Il recrée également les liens hypertexte vers les sites web ou les adresses e-mail. L'option Utiliser des colonnes et non des cadres crée des documents en colonnes. Le texte disposé en colonnes est plus facile à modifier que les documents contenant plusieurs cadres : le texte s'enchaîne d'une colonne à l'autre. Remarque : lorsque le système n'est pas en mesure de détecter les colonnes dans le document d'origine, ce mode de formatage utilise des cadres comme solution alternative. L'option Insérer des sauts de colonne ajoute un saut de colonne forcé à la fin de chaque colonne. Tout texte que vous modifiez, ajoutez ou supprimez reste à l'intérieur de sa colonne. Il ne passe jamais automatiquement à la colonne suivante. 71 Chapitre 9 – Formatage et enregistrement de documents Conseil : désactivez cette option lorsque vous avez du texte continu en colonne. Vous garantirez ainsi l'enchaînement continu du texte d'une colonne à l'autre. L'option Inclure l'image en arrière-plan du texte place l'image numérisée en arrière-plan de la page derrière le texte reconnu. Notez toutefois que cette option augmente sensiblement la taille des fichiers de sortie. Le format PDF Texte-Image offre un résultat identique pour les fichiers PDF. L'option Sauvegarder la couleur de l'arrière-plan de l'onglet Options offre une alternative plus compacte. o L'option Reconstituer les paragraphes permet d'activer la détection automatique des paragraphes. Readiris insère des retours à la ligne automatiques dans le texte reconnu jusqu'au début d'un nouveau paragraphe et « recolle » les mots coupés en fin de ligne. o L'option Inclure les images inclut les images dans les fichiers formatés automatiquement. Ceci est indispensable pour créer une copie fidèle d'un document. Utilisez les options d'image de l'onglet Images afin de déterminer la résolution et le mode couleur des images figurant dans les fichiers de sortie. o L'option Sauvegarder les couleurs du texte préserve les couleurs d'origine du texte lors de la reconnaissance. o Quant à l'option Sauvegarder la couleur de l'arrièreplan, elle préserve les couleurs d'accompagnement de l'arrière-plan de la page lors de la reconnaissance. Remarque : cette option recrée la couleur de l'arrière-plan de chaque cellule lors de la reconnaissance des tableaux. 72 ReadirisTM Corporate 12 – Guide Utilisateur Une fois les options sélectionnées, cliquez sur OK. Cliquez ensuite sur Reconnaître + Enregistrer pour lancer la reconnaissance du document. SELECTION DES OPTIONS D'IMAGE Selon le format de sortie sélectionné, vous pouvez accéder à certaines options d'image avancées. Les options d'image peuvent servir à modifier la qualité et la résolution de l'image. Pour accéder aux options d'image : Cliquez sur l'icône Format de sortie de la barre d'outils principale. Sélectionnez le format de sortie souhaité dans la liste Format. Cliquez sur l'onglet Images pour afficher les options d'image : Les options non disponibles s'affichent en grisé. 73 Chapitre 9 – Formatage et enregistrement de documents Profondeur Par défaut, Readiris enregistre les images avec leur profondeur d'origine. Readiris peut également enregistrer les images couleur, en noir et blanc et en niveaux de gris. Qualité Vous avez le choix entre la qualité d'image Inférieure, Normale et Supérieure. Résolution Par défaut, Readiris conserve la résolution d'origine. Toutefois, vous pouvez décider de diminuer la résolution en choisissant une valeur (en ppp) inférieure. Notez toutefois qu'il n'est pas possible d'augmenter la résolution. Conseil : lors de l'enregistrement de documents au format HTML en vue de leur publication sur un site Web, réduisez la résolution à 70 ppp (résolution d'écran). Une fois les options sélectionnées, cliquez sur OK. Cliquez ensuite sur Reconnaître + Enregistrer pour lancer la reconnaissance du document. 74 ReadirisTM Corporate 12 – Guide Utilisateur ENREGISTREMENT DES DOCUMENTS EN TANT QUE FICHIERS IMAGE Bien que Readiris soit une application d'OCR, il permet également d'enregistrer vos documents sous la forme de fichiers image sans leur appliquer la reconnaissance. Readiris offre la possibilité d'enregistrer les documents en tant qu'images JPEG, JPEG 2000, Photoshop, PICT, PNG, TIFF et bitmap Windows. Procédure Cliquez sur l'icône Format de sortie de la barre d'outils principale. Sélectionnez le format d'image souhaité dans la liste Format. Remarque : les options de l'onglet Images NE s'appliquent PAS lorsque vous enregistrez des documents sous la forme de fichiers image. En revanche, elles s'appliquent aux images figurant dans les 75 Chapitre 9 – Formatage et enregistrement de documents documents générés par le processus de reconnaissance. Pour plus d'informations, consultez la section Sélection des options d'image. Vous pouvez ouvrir les images enregistrées immédiatement après l'exportation dans l'application de votre choix. Cliquez sur le bouton Choisir en regard de la liste Envoyer à pour sélectionner une application. Si vous voulez simplement enregistrer vos images sans les ouvrir, sélectionnez Aucun dans la liste Envoyer à. Ensuite, cliquez sur Reconnaître + Enregistrer dans la barre d'outils principale pour enregistrer votre document sous la forme d'un fichier image. Vous pouvez également cliquer sur Enregistrer le document dans le menu Fichier. Remarques : Vous pouvez également utiliser la commande Copier les zones d'image du menu Zones pour envoyer toutes les images d'une page vers le Presse-papiers. Vous pouvez également faire glisser les miniatures d'image du tiroir vers le Bureau pour les enregistrer au format JPEG. CREATION DE DOCUMENTS PDF Readiris génère quatre types de sorties PDF : texte, texte-image, image-texte et image. Pour générer des fichiers de sortie au format PDF : Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF dans la liste Format. Ensuite, sélectionnez le type PDF que Readiris doit générer : 76 ReadirisTM Corporate 12 – Guide Utilisateur PDF Texte Lorsque vous sélectionnez l'option PDF Texte, Readiris effectue la reconnaissance du texte et crée des fichiers PDF indexés. L’image de la page n'est pas contenue dans ces fichiers PDF monocouches . PDF Texte-Image Lorsque vous sélectionnez l'option PDF Texte-Image, Readiris effectue la reconnaissance du texte et crée des fichiers PDF indexés qui contiennent l'image de la page ainsi que le texte généré suite à la reconnaissance. L'image de la page est placée derrière le texte. PDF Image Lorsque vous sélectionnez l'option PDF Image, Readiris génère des documents PDF comportant uniquement une image, il n'exécute pas la reconnaissance OCR. PDF Image-Texte Lorsque vous sélectionnez l'option PDF Image-Texte, Readiris effectue la reconnaissance du texte et crée des fichiers PDF indexés qui contiennent l'image de la page ainsi que le texte généré suite à la reconnaissance. 77 Chapitre 9 – Formatage et enregistrement de documents L'image de la page est placée au-dessus du texte. Avec ce format, vous pouvez toujours voir le document d'origine (tel qu'il a été numérisé) tout en ayant la possibilité d'effectuer des recherches et des copier-coller dans le texte issu de la reconnaissance. Le texte est masqué par l'image. Ce format est donc utile à des fins d'archivage. Une fois les options sélectionnées, cliquez sur OK. Cliquez ensuite sur Reconnaître + Enregistrer pour lancer la reconnaissance du document. SELECTION DES OPTIONS PDF Pour sélectionner les options PDF : Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF. Selon le type de PDF sélectionné, plusieurs options sont disponibles : Cliquez sur l'onglet Options PDF pour y accéder : 78 ReadirisTM Corporate 12 – Guide Utilisateur Versions Sélectionnez la version du format PDF à générer. Remarque : Adobe Acrobat 5.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.4. Adobe Acrobat 6.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.5. Adobe Acrobat 7.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.6. Adobe Acrobat 8.0 ou version ultérieure est nécessaire pour ouvrir les documents PDF 1.7. Documents PDF/A Outre les documents PDF « normaux », Readiris propose une sortie PDF/A. Sélectionnez simplement l'option Conforme à PDF/A. Les fichiers PDF/A sont utilisés pour l'archivage à long terme et contiennent uniquement les éléments nécessaires à leur ouverture et à leur consultation. Remarque : utilisez Adobe Reader au lieu de l'application Aperçu standard pour ouvrir les documents PDF/A. Inclure les polices Sélectionnez l'option Inclure les polices pour incorporer les polices dans les fichiers PDF. L'inclusion des polices permet d'empêcher toute substitution des polices et garantit que les lecteurs, indépendamment de la 79 Chapitre 9 – Formatage et enregistrement de documents configuration de leur ordinateur, voient le texte avec ses polices d'origine. Notez toutefois que cette option augmente quelque peu la taille de fichier des documents de sortie de la reconnaissance. Créer des signets L'option Créer des signets permet de créer des signets pour chaque bloc de texte, image et tableau dans les fichiers PDF. iHQC - technologie intelligente de compression haute qualité Outre les quatre types de sortie PDF « normale », Readiris propose une sortie PDF compressée avec iHQC : les documents PDF de type image-texte et image peuvent être hypercompressés au moyen d'iHQC sans perte de qualité d'image. iHQC (intelligent HighQuality Compression) est la technologie d'hypercompression exclusive d'I.R.I.S. iHQC est aux images ce que MP3 est à la musique et ce que DivX est à la vidéo. Sélectionnez soit Petite taille pour réduire le plus possible la taille des documents, soit Bonne qualité pour obtenir des documents de taille légèrement supérieure mais de meilleure qualité. Vous pouvez aussi sélectionner Personnalisé et déplacer le curseur vers la droite pour obtenir un juste équilibre entre la taille minimale et une qualité optimale. Remarque : Adobe Reader est nécessaire pour ouvrir les fichiers PDF compressés au moyen d'iHQC. Ceux-ci ne s'ouvrent pas correctement dans l'application Aperçu par défaut. 80 ReadirisTM Corporate 12 – Guide Utilisateur DOCUMENTS PDF PROTEGES PAR MOT DE PASSE Readiris vous permet de limiter l'accès aux fichiers de sortie PDF à l'aide de mots de passe. Vous pouvez spécifier un mot de passe d'ouverture du document, qui devra être fourni pour que le document puisse être ouvert, et un mot de passe d'autorisations, visant à empêcher l'impression et la modification du document. Avertissement : si vous oubliez ou perdez ces mots de passe, vous devrez utiliser un logiciel de récupération de mots de passe. Pour appliquer la protection par mot de passe : Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF. Cliquez sur l'onglet Mots de passe PDF et sélectionnez les options de sécurité voulues. 81 Chapitre 9 – Formatage et enregistrement de documents Lorsque vous définissez un mot de passe d'ouverture du document, vous êtes invité à entrer ce mot de passe lors de l'ouverture du fichier de sortie PDF. Lorsque vous définissez un mot de passe d'autorisations, vous pouvez uniquement effectuer les opérations spécifiées dans les options de sécurité. Si vous souhaitez modifier ces options, vous devez entrer le mot de passe d'autorisations. Les options de sécurité Readiris sont similaires aux fonctionnalités de protection standard d'Adobe Acrobat. Notez toutefois que le mot de passe d'ouverture du document et le mot de passe d'autorisations de Readiris doivent être différents. Si un document PDF est protégé par les deux types de mot de passe, vous pouvez utiliser l'un des deux pour ouvrir le document. ADAPTATION DES DOCUMENTS PDF En plus de générer des documents PDF, Readiris peut également adapter les fichiers PDF : Readiris convertit des PDF image en PDF texte ou tout autre format texte pris en charge et déverrouille le contenu PDF en lecture seule. Avertissement : Readiris n'ouvre pas les documents PDF protégés par mot de passe. Procédure Cliquez sur le bouton Ouvrir dans la barre d'outils principale et sélectionnez le fichier PDF que Readiris doit adapter. Si nécessaire, indiquez les pages à ouvrir. 82 ReadirisTM Corporate 12 – Guide Utilisateur Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez PDF dans la liste Format. Ensuite, sélectionnez le type PDF de votre choix et cliquez sur OK pour quitter la définition des paramètres. Pour plus d'informations sur les types de fichier PDF, consultez la section Création de documents PDF. Cliquez sur le bouton Reconnaître + Enregistrer pour adapter le document. SELECTION DE LA TAILLE DE PAGE Dans Readiris, la taille de page des documents que vous numérisez et ouvrez ne doit pas nécessairement être la même que celle des documents de sortie. Lorsque vous générez des documents OpenDocument Text, Open XML (.docx et .xlsx) ou RTF, vous pouvez sélectionner ou exclure les tailles de page de votre choix. Pour ce faire, procédez comme suit : Cliquez sur l'icône Format de sortie de la barre d'outils principale et sélectionnez les formats de sortie mentionnés ci-dessus dans la liste Format. Cliquez ensuite sur l'onglet Tailles de page pour accéder à ces options. Cochez les tailles de page que vous souhaitez inclure et décochez celles que vous voulez exclure. Readiris parcourt les tailles de page actives dans l'ordre indiqué et utilise la première taille suffisamment grande pour contenir le 83 Chapitre 9 – Formatage et enregistrement de documents document numérisé. Si vous voulez modifier l'ordre de tri, il vous suffit de faire glisser les tailles de page pour les réorganiser comme bon vous semble dans la liste. Cliquez sur Par défaut pour rétablir les paramètres par défaut. Une fois terminé, cliquez sur OK pour enregistrer les paramètres et quitter. 84 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 10 ENREGISTREMENT ET CHARGEMENT DES PARAMETRES Lorsque vous quittez Readiris, vous êtes invité à confirmer si vous voulez enregistrer les paramètres que vous avez spécifiés et les utiliser en tant que configuration par défaut. Si vous acceptez, la prochaine fois que vous exécuterez Readiris, le programme s'ouvrira en utilisant cette nouvelle configuration par défaut. Pour rétablir la configuration d'usine, cliquez sur la commande Rétablir la configuration d'usine dans le menu Configuration. Lorsque vous numérisez plusieurs groupes de documents qui exigent une configuration différente, il est utile d'enregistrer un fichier de configuration distinct pour chaque groupe. Procédure Sélectionnez les paramètres à utiliser pour un groupe de documents donné. Dans le menu Configuration, cliquez sur la commande Enregistrer. Vous pouvez également cliquer sur Enregistrer par défaut si vous voulez utiliser ces paramètres comme configuration par défaut. Les paramètres suivants seront enregistrés : type de document, langues principale et secondaire, Favoriser la précision de reconnaissance sur la vitesse, style de carte, type de police, espacement des caractères, format de sortie et toutes les options relatives au format de sortie sélectionnées, y compris les mots de passe de protection des documents PDF, l'application cible, les tailles de page, la séparation 85 Chapitre 10 – Enregistrement et chargement des paramètres des pages et les paramètres d'indexation ainsi que les options de lexique utilisateur, d'analyse de page, d'élimination du bruit et de redressement des pages et d'apprentissage interactif. Lorsque vous numérisez ou ouvrez par la suite un document du même groupe, cliquez sur la commande Ouvrir du menu Configuration. Sélectionnez le fichier de configuration approprié et cliquez sur Ouvrir. Cliquez sur Reconnaître + Enregistrer pour lancer la reconnaissance du document en appliquant les paramètres adéquats. 86 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 11 RECONNAISSANCE D'IMPORTANTS VOLUMES D'IMAGES NUMERISEES TRAITEMENT PAR LOTS Readiris offre une puissante fonctionnalité de reconnaissance de lots d'images numérisées : le traitement par lots. La fonction de traitement par lots exécute la reconnaissance de toutes les images numérisées dans un dossier spécifique. Précisez à Readiris le dossier dans lequel les documents sont placés, lancez le processus d'OCR et tous les documents sont convertis dans le format de sortie requis. Procédure Commencez par sélectionner tous les paramètres à appliquer ainsi que le format de sortie à créer. Pour plus d'informations sur les différents paramètres et formats de sortie, reportez-vous aux sections correspondantes de ce guide d'utilisateur. Dans le menu Action, cliquez sur Traitement par lots. Cliquez sur les boutons Choisir pour sélectionner le dossier images et le dossier texte. 87 Chapitre 11 – Reconnaissance d'importants volumes d'images numérisées Ces dossiers peuvent être différents mais ce n'est pas obligatoire. Pour sélectionner les options de traitement : o Sélectionnez Traiter les sous-dossiers pour traiter tous les sous-dossiers du dossier image. Si le dossier de sortie est différent du dossier image, tous les sous-dossiers seront recréés dans le dossier de sortie en respectant la structure du dossier image. o Sélectionnez Ecraser les fichiers texte pour remplacer les résultats de reconnaissance précédents. o Sélectionnez Supprimer les images traitées pour supprimer les fichiers du dossier image. Cliquez sur OK pour lancer la reconnaissance. Readiris traite les images de tous les formats de fichier pris en charge. Il n'est pas possible de limiter la reconnaissance OCR à des fichiers présentant un format spécifique. Les documents créés au terme du processus de reconnaissance se voient attribuer le même nom de fichier que les fichiers image d'origine. Un fichier journal est créé pour chaque lot ; il contient la date de traitement et les noms ainsi que les chemins d'accès des documents. 88 ReadirisTM Corporate 12 – Guide Utilisateur CONFIGURATION D'UN DOSSIER SURVEILLE En plus d'exécuter le traitement par lots, Readiris peut effectuer le suivi d'un dossier surveillé. Tout fichier image placé ou modifié au sein du dossier surveillé est immédiatement traité par Readiris. Le logiciel d'OCR peut rester en permanence en cours d'exécution. Remarque : la fonction Dossier surveillé est très pratique si vous utilisez un scanner qui stocke les images automatiquement dans un dossier prédéfini. Procédure Commencez par sélectionner tous les paramètres à appliquer ainsi que le format de sortie à créer. Pour plus d'informations sur les différents paramètres et formats de sortie, reportez-vous aux sections correspondantes de ce guide d'utilisateur. Dans le menu Action, cliquez sur Dossier surveillé. Cliquez sur les boutons Choisir pour sélectionner le dossier images et le dossier texte. Le dossier image doit être différent du dossier texte. De plus, aucun des deux ne peut être un sous-dossier de l'autre. 89 Chapitre 11 – Reconnaissance d'importants volumes d'images numérisées Pour sélectionner les options de traitement : o Sélectionnez Traiter les sous-dossiers pour traiter tous les sous-dossiers du dossier image. Si le dossier de sortie est différent du dossier image, tous les sous-dossiers seront recréés dans le dossier de sortie en respectant la structure du dossier image. o Sélectionnez Ecraser les fichiers texte pour remplacer les résultats de reconnaissance précédents. o Sélectionnez Supprimer les images traitées pour supprimer les fichiers du dossier image. Cliquez sur OK pour effectuer le suivi du dossier surveillé. Readiris traite les images de tous les formats de fichier pris en charge. Il n'est pas possible de limiter la reconnaissance OCR à des fichiers présentant un format spécifique. Les documents de sortie de la reconnaissance sont enregistrés en tant que fichiers externes dans le dossier texte spécifié et se voient attribuer le même nom de fichier que les fichiers image d'origine. 90 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 12 SEPARATION ET INDEXATION DES LOTS DE DOCUMENTS SEPARATION DES LOTS DE DOCUMENTS Lorsque vous numérisez ou ouvrez plusieurs documents, il est impératif d'indiquer à Readiris où se termine un document et où commence l'autre. Pour ce faire, vous pouvez utiliser des pages blanches ou des pages de code à barres. Séparation des documents numérisés Lorsque vous numérisez des documents, insérez une page blanche ou une page de code à barres entre les différents documents présents dans le bac d'alimentation de votre scanner. Lorsque vous ouvrez des documents, placez un fichier vide ou un fichier contenant un code à barres entre les fichiers à séparer. Dans le menu Configuration, cliquez sur Séparation de documents et indexation. 91 Chapitre 12 – Séparation et indexation des lots de documents Sélectionnez l'option Détecter les pages blanches ou Détecter les couvertures avec un code à barres, selon le type de page de séparation que vous utilisez. Readiris détecte les pages blanches et les pages de code à barres et les marque comme couvertures. Une page est dite blanche lorsqu'elle contient uniquement du bruit. Notez qu'en cas de besoin, vous pouvez supprimer toutes les pages blanches simultanément après la reconnaissance : cliquez pour cela sur l'option Supprimer les pages blanches du menu Action. Si vous utilisez des pages de code à barres en guise de couvertures, vous pouvez indiquer des données spécifiques que vos codes à barres doivent contenir pour que Readiris les considère comme des pages de code à barres. Insérez par exemple le nom de votre société, I.R.I.S. dans notre cas, dans le champ contenant. Seuls les codes à barres qui contiennent le terme « I.R.I.S. » seront marqués comme des couvertures et seront utilisés pour séparer votre lot de documents en documents distincts. Vous pouvez également ajouter une variable aux données, par exemple une date de numérisation. Cette variable indiquera les données d'indexation spécifiques de chaque document. 92 ReadirisTM Corporate 12 – Guide Utilisateur Pour inclure les résultats de reconnaissance des couvertures, sélectionnez Reconnaître les couvertures. Cliquez sur OK pour enregistrer les paramètres. Cliquez ensuite sur le bouton Numériser pour numériser les documents. Les images numérisées sont affichées dans Readiris, et les pages blanches ou les pages de code à barres sont marquées comme couvertures. Cliquez sur le bouton Reconnaître + Enregistrer pour traiter les documents. Le lot de documents est segmenté et ses différentes parties sont enregistrées dans des documents de sortie distincts. Séparation des documents ouverts manuellement Cliquez sur le bouton Ouvrir de la barre d'outils principale et sélectionnez les documents à ouvrir. Utilisez la fonction Traitement par lots ou Dossier surveillé lorsque vous numérisez d'importants volumes de documents. Le tiroir affiche les miniatures des pages. Tout en maintenant la touche Ctrl enfoncée, cliquez sur les pages à marquer comme couvertures, puis cliquez sur Couverture. Les miniatures de page deviennent des couvertures dans le tiroir à images. Les pages contenant un code à barres deviennent une couverture à code à barres. 93 Chapitre 12 – Séparation et indexation des lots de documents Vous pouvez également ouvrir le menu Action, pointer sur Modifier les pages sélectionnées puis sélectionner Couverture. Cliquez sur le bouton Reconnaître + Enregistrer pour traiter les documents. INDEXATION DES LOTS DE DOCUMENTS En plus de séparer les lots de documents, Readiris permet également de les indexer. Readiris peut générer un fichier d'index XML contenant des informations détaillées sur les documents traités et, si l'option est sélectionnée, sur les résultats de l'OCR. Le fichier d'index XML peut être utilisé par la suite à des fins de programmation. Pour activer l'indexation de documents : Dans le menu Configuration, cliquez sur Séparation de documents et indexation. 94 ReadirisTM Corporate 12 – Guide Utilisateur Sélectionnez Générer un index XML. Un fichier d'index XML est créé pour chaque document. Ce fichier d'index contient des informations détaillées telles que les séparateurs de type codes à barres détectés, l'étendue de pages, le nom du fichier de sortie et le texte de la couverture (si cette option est sélectionnée). Pour inclure le texte des couvertures dans l'index XML, sélectionnez l'option correspondante. Notez que ces résultats de lecture ne sont pas inclus dans le document de sortie. Cliquez sur OK pour enregistrer les paramètres de traitement des documents. Cliquez sur le bouton Reconnaître + Enregistrer pour traiter les documents. L'index XML sera placé dans le même dossier que le document de sortie. Les résultats de la lecture de codes à barres sont enregistrés dans l'index XML, pas dans les documents de sortie. 95 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 13 RECONNAISSANCE DE TEXTE MANUSCRIT En plus du texte dactylographié, des tableaux, des images et des codes à barres, Readiris assure la reconnaissance du texte manuscrit. Par texte manuscrit, l'on entend les lettres capitales distinctes. Pour effectuer la reconnaissance du texte manuscrit : Cliquez sur l'icône représentant un pointeur dans la barre d'outils Image. Sélectionnez Tracer des zones de texte manuscrit. Dessinez un cadre autour du texte manuscrit devant faire l'objet de la reconnaissance. Cliquez sur Reconnaître + Enregistrer dans la barre d'outils principale. La reconnaissance sera appliquée à l'ensemble du document, y compris au texte manuscrit. Important : le texte manuscrit doit être rédigé clairement. Conseil : si vous n'obtenez pas de bons résultats, utilisez le formulaire d'écriture d'I.R.I.S. afin d'adapter votre style d'écriture. Le formulaire d'écriture vide d'I.R.I.S. sert de modèle page pleine sur lequel vous pouvez écrire en lettres capitales en respectant la taille et l'espacement 97 Chapitre 13 – Reconnaissance de texte manuscrit corrects. Ce formulaire figure sur le CD-ROM de Readiris et dans le dossier d'installation de Readiris. Remarque : tout en maintenant la touche Ctrl enfoncée, cliquez sur une zone de texte manuscrit, puis cliquez sur Copier le texte pour que la reconnaissance porte uniquement sur la zone de texte manuscrit et pour envoyer le résultat vers le Presse-papiers. Symboles reconnus : La reconnaissance de l'écriture manuscrite est limitée à l'alphabet latin et prend en charge les chiffres (0 – 9), les lettres majuscules (A – Z) et certains signes de ponctuation (virgule, point, signe plus et tiret). Les accents, les trémas et autres caractères spéciaux ne sont pas pris en charge. Remarques Readiris prend en charge l'écriture manuscrite en lettres capitales, pas l'écriture manuscrite liée. Les caractères en majuscules sont remplacés par des minuscules après la reconnaissance, à moins qu'ils ne soient placés en début de phrase. Les caractéristiques du document tel que la langue, le type de police et l'espacement des caractères ne s'appliquent pas au texte manuscrit. L'apprentissage interactif ne s'applique pas non plus à cette fonction. La technologie ICR a été développée à partir de plus d'un million d'échantillons d'écriture. 98 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 14 RECONNAISSANCE DES CODES A BARRES PRÉSENTATION DE LA LECTURE DES CODES À BARRES En plus de la reconnaissance optique des caractères (OCR) dans 125 langues, Readiris propose également la lecture des codes à barres. Il est possible d'effectuer une reconnaissance manuelle ou automatique des codes à barres lorsqu'ils sont utilisés à des fins d'indexation. Toutes les symbologies les plus courantes des codes à barres sont prises en charge : Codabar, Code 128, Code 39, Code 39 extended, Code 39 HIBC, Code 93, Discrete 2 of 5, EAN-13, EAN-2, EAN-5, EAN-8, Interleaved 2 of 5, MSI Pharmaceutical, MSI-Plessey, code patch Kodak, PDF-417, PostNet, PostNet 32, PostNet 52, PostNet 62, UCC-128, UPC-A et UPC-E. Remarque : les codes à barres doivent être imprimés avec des imprimantes laser ou à jet d'encre pour que Readiris puisse effectuer la reconnaissance OCR. Les codes à barres à impression matricielle ne sont pas pris en charge dans la mesure où le contraste obtenu 99 Chapitre 14 – Reconnaissance des codes à barres n'est pas suffisant et où leur résolution est généralement limitée à 60 ppp. Lecture manuelle des codes à barres Cliquez sur l'icône représentant un pointeur dans la barre d'outils Image. Sélectionnez ensuite Tracer des zones de code à barres. Dessinez un cadre autour des zones de code à barres que Readiris doit soumettre à la reconnaissance. Cliquez sur Reconnaître + Enregistrer dans la barre d'outils principale. La reconnaissance sera appliquée à l'ensemble du document, y compris aux codes à barres. Remarque : tout en maintenant la touche Ctrl enfoncée, cliquez sur une zone de code à barres, puis cliquez sur Copier les données pour en copier le contenu dans le Presse-papiers. Lecture automatique des codes à barres Les codes à barres peuvent être utilisés comme séparateurs entre les différents documents d'un lot de documents. Readiris peut automatiquement rechercher des pages de code à barres et les marquer comme couvertures, indiquant le début d'un nouveau document. Dans le menu Configuration, cliquez sur Séparation de documents et indexation. Sélectionnez l'option Détecter les couvertures avec un code à barres. Si nécessaire, indiquez le contenu spécifique que Readiris doit rechercher. Pour plus d'informations, consultez la section Séparation des lots de documents. 100 ReadirisTM Corporate 12 – Guide Utilisateur Remarque : les résultats de la lecture des codes à barres peuvent être inclus dans un index XML. Sélectionnez l'option Générer un index XML et cochez la case Inclure le texte des couvertures dans l'index. Cliquez sur OK pour enregistrer les paramètres. Cliquez ensuite sur Reconnaître + Enregistrer dans la barre d'outils principale. 101 ReadirisTM Corporate 12 – Guide Utilisateur CHAPITRE 15 RECONNAISSANCE DES CARTES DE VISITE PRÉSENTATION DE LA LECTURE DES CARTES DE VISITE Outre la reconnaissance des documents « normaux », Readiris offre également une fonction de reconnaissance des cartes de visite. Readiris permet de numériser les cartes de visite, de leur appliquer la reconnaissance et de les convertir en une base de données d'adresses. Grâce à l'OCR (Optical Character Recognition, reconnaissance optique des caractères), les données figurant sur les cartes de visite sont extraites automatiquement de l'image, converties en texte modifiable et insérées dans le champ correct de la base de données grâce à l'analyse des champs. Cette fonction prend en charge 52 pays. Outre l'analyse, Readiris procède à un formatage du texte reconnu. Les données qui résultent de ce traitement peuvent être exploitées de différentes manières : il est possible de stocker les contacts dans le Carnet d'adresses ou de les exporter dans des fichiers HTML, Unicode (texte) ou vCard. Vous pouvez également ouvrir ces fichiers de sortie directement dans l'application de votre choix. Readiris complète parfaitement des applications telles que les gestionnaires de contacts, les gestionnaires de bases de données et même les applications de traitement de texte dont la fonction 103 Chapitre 15 – Reconnaissance des cartes de visite de « publipostage » permet d'imprimer des lettres, des enveloppes et des étiquettes. Pour effectuer la reconnaissance des cartes de visite : Cliquez sur le bouton Type de document dans la barre d'outils principale et cliquez sur Cartes de visite. Conseil : sélectionnez une résolution de numérisation de 400 à 500 ppp pour une reconnaissance optimale des cartes de visite. Pour ce faire, cliquez sur Préférences dans le menu Readiris et modifiez la résolution. Les options requises sont activées de façon implicite par défaut : Readiris applique automatiquement le redressement des pages, la détection de l'orientation des pages et l'analyse de page. Si nécessaire, vous pouvez également activer les options d'élimination du bruit pour supprimer les petits points parasites de vos cartes de visite. Cliquez sur le bouton Ouvrir pour ouvrir une carte de visite numérisée. Vous pouvez également cliquer sur le bouton Numériser pour numériser une carte de visite papier. Avant de vous atteler à la numérisation de cartes de visite, assurezvous que votre scanner est connecté à votre Mac et correctement configuré. Cliquez sur Préférences dans le menu Readiris et vérifiez la configuration de votre scanner. Pour plus d'informations, consultez la section Numérisation de documents papier. Remarque : si vous utilisez un scanner à plat, vous pouvez numériser plusieurs cartes de visite à la fois sur le plateau du scanner et les faire segmenter par le logiciel. Readiris scindera alors l'image d'origine en 104 ReadirisTM Corporate 12 – Guide Utilisateur images de carte, éliminant les bordures noires superflues. Remarque : assurez-vous cependant que l'arrière-plan est noir en laissant le capot du scanner ouvert lors de la numérisation. Readiris affiche la carte de visite analysée. Le cas échéant, changez les types de zones : appuyez sur la touche CTRL et cliquez sur la zone à modifier, puis sélectionnez un autre type de zone. Cliquez sur l'icône représentant un globe pour sélectionner le style de carte approprié. Si vous numérisez des cartes de visite de différents pays, vous pouvez modifier manuellement le style de carte par carte au moyen du tiroir à images: il suffit d'appuyer sur la touche CTRL et de cliquer sur une miniature de carte dans le tiroir, puis de cliquer sur Pays et de sélectionner le style de carte de votre choix. Conseil : utilisez le style de carte Autre pays si vos cartes proviennent de pays non pris en charge. Un jeu de caractères très étendu s'applique alors : la reconnaissance peut s'effectuer sur des cartes de visite de n'importe quelle langue latine. Cliquez sur l'icône Format pour sélectionner le format de sortie. 105 Chapitre 15 – Reconnaissance des cartes de visite Les cartes de visite peuvent être enregistrées au format HTML, Unicode et vCard ou être envoyées vers l'application Carnet d'adresses. En fonction du format sélectionné, vous pouvez choisir d'inclure les noms des champs et/ou les images de carte de vos cartes de visite. Si vous sélectionnez Unicode, plusieurs délimiteurs de champ sont disponibles. Les délimiteurs de champ sont les symboles qui séparent les différents champs de base de données au sein d'un enregistrement d'adresse. Notez toutefois que vous pouvez avoir recours à l'application Carnet d'adresses pour importer vos contacts dans d'autres bases de données et gestionnaires de contacts. Pour découvrir comment faire, consultez la documentation du Carnet d'adresses. Conseil : utilisez le logiciel gratuit Apple iSync (Mac OS X) pour synchroniser vos contacts sur les ordinateurs Macintosh et d'autres dispositifs tels les ordinateurs de poche iPod ou Palm OS et les téléphones mobiles compatibles Bluetooth. En fonction du format choisi, Readiris lance l'application associée pour l'ouverture des types de fichiers sélectionnés dans 106 ReadirisTM Corporate 12 – Guide Utilisateur la liste Envoyer à. Pour sélectionner une autre application, cliquez sur le bouton Choisir. Conseil : pour envoyer des contacts par e-mail, sélectionnez vCard comme format de carte et votre logiciel de messagerie (Apple Mail, Microsoft Entourage, etc.) comme application cible. Un nouvel e-mail sera créé et le fichier vCard y sera ajouté en tant que pièce jointe. Cliquez sur Reconnaître + Enregistrer pour appliquer la reconnaissance aux cartes de visite et les exporter. L'option Apprentissage interactif est également disponible pour la lecture des cartes de visite. Pour plus d'informations, consultez la section Utilisation de l'apprentissage interactif. 107 ReadirisTM Corporate 12 – Guide Utilisateur INDEX A adaptation des documents PDF ............................................... 82 Configuration du scanner........ 18 configuration d'usine .............. 85 configuration requise .............. 11 analyse de page ...................... 25 contraste ................................. 36 appareil photo numérique....... 30 couleur d'arrière-plan .............. 72 apprentissage interactif .......... 60 assistance produits ................. 13 B barre d'outils de droite ............ 16 couleur d'arrière-plan des cellules de tableau................... 67 couvertures ............................. 91 D barre d'outils Image ................ 16 désalignement ......................... 31 barre d'outils principale .......... 16 désinstallation de Readiris ...... 12 C caractéristiques du document . 59 dictionnaires de polices .......... 64 documents avec données tabulaires ................................ 67 Carnet d'adresses .................. 106 cartes de visite...................... 103 documents de plusieurs pages 25, 27 chargement des paramètres .... 85 documents en hébreu ...... 4, 8, 51 codes à barres ......................... 99 documents en langue asiatique 4, 8, 51 configuration du scanner ........ 27 documents PDF ...................... 76 109 Index documents texte ..................... 67 indexation de documents ........ 94 dossier surveillé ..................... 89 installation .............................. 11 Drop2Read ............................. 21 interface utilisateur ................. 16 E L élimination du bruit .......... 25, 36 langue ..................................... 52 enregistrement ........................ 13 langue de l'interface utilisateur18 enregistrement de paramètres . 85 langue du document ................ 52 enregistrement en tant que fichier image .......................... 75 langue principale .................... 53 Langues asiatiques ................ 4, 8 espacement des caractères ...... 60 langues secondaires ................ 54 Exécution de Readiris ............ 15 lexiques utilisateur .................. 56 F lissage des images couleur 29, 33 fichiers de zones..................... 47 luminosité ............................... 34 fichiers image......................... 25 M formats de sortie..................... 67 matriciel .................................. 59 formats d'image pris en charge25 mode couleur .......................... 28 I modèles de zonage .................. 47 I.R.I.S. .................................... 13 multilingues ............................ 54 Image Capture ........................ 18 N image couleur................... 28, 33 numérique ............................... 53 image en niveaux de gris.. 28, 33 numérisation de documents .... 27 image en noir et blanc ...... 28, 33 images inversées .................... 29 110 ReadirisTM Corporate 12 – Guide Utilisateur O optimisation des documents numérisés ............................... 33 sortie HTML ................... 67, 106 sortie OpenDocument ............. 67 options ................................... 24 sortie PDF protégée par mot de passe ....................................... 81 options de mise en page ......... 70 sortie PDF/A ........................... 79 options d'image ...................... 73 sortie PDF-iHQC .................... 80 P pages ...................................... 18 déplacement........................ 18 sortie RTF ............................... 67 sortie Unicode......................... 67 T suppression ......................... 18 tableaux .................................. 67 pages de code à barres............ 91 tailles de page ......................... 83 précision ou vitesse ................ 52 texte manuscrit ....................... 97 R recréation du document d'origine ............................................... 71 tiroir ........................................ 18 tiroir à images ......................... 18 traitement par lots ................... 87 redressement ...................24, 104 Twain...................................... 18 redressement de la page ......... 24 type de document.................... 23 résolution ............................... 27 type de police.......................... 59 rétablissement de la configuration d'usine .............. 85 rotation ................................... 24 S U Unicode ................................ 106 V séparation de documents ........ 91 vCard .................................... 106 sortie Excel ............................ 67 vitesse ou précision................. 52 111 Index Z zonage automatique ............... 39 112 zonage manuel ........................ 41