Depot Institutionnel de l'UMBB >
Mémoires de Master 2 >
Faculté des Sciences >
Infotronique >
Ingénierie de logiciels et de l'information* >
Veuillez utiliser cette adresse pour citer ce document :
http://dlibrary.univ-boumerdes.dz:8080/handle/123456789/3716
|
Titre: | Traitement et reconnaissance des caractères |
Auteur(s): | Baka, Abedeladim Fillali, Hicham |
Mots-clés: | Prétraitement des images Binarisation Filtres Tesseract |
Date de publication: | 2016 |
Résumé: | Un système de reconnaissance optique des caractères analyse optiquement un texte
et en produit une version informatique, sous forme d'un _chier texte, comme s'il avait
été saisi sur un ordinateur. On utilise également l'acronyme OCR du terme anglais Optical Character Recognition. L'OCR est évidemment une technique utile, mais il faut en connaître les limites et en tenir compte, en prévoyant une ou plusieurs lectures personnelles du document. Parfois les documents à traiter peuvent être dégradé physiquement ou lors de leurs acquisition pour cela l'étape de prétraitement est donc indispensable afin de rendre faible l'étape de conversion de l'image vers un texte, Les filtres linéaires pour le traitement du bruit, tel que le filtre gaussien, moyen ...etc. permettent de lisser l'image et ainsi diminuer le bruit qui pourrait impacter négativement sur le résultat de reconnaissance sans garantir la conversion des contours. Pour améliorer les résultats de l'OCR, nous allons utiliser quelques prétraitements pour améliorer la performance de l'OCR. |
Description: | 76 p. : ill. ; 30 cm |
URI/URL: | http://dlibrary.univ-boumerdes.dz:8080/handle/123456789/3716 |
Collection(s) : | Ingénierie de logiciels et de l'information*
|
Fichier(s) constituant ce document :
|
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.
|