Main Content

La traduction de cette page n'est pas à jour. Cliquez ici pour voir la dernière version en anglais.

Détection et reconnaissance de texte

Détecter et reconnaître du texte grâce à la détection et la description de caractéristiques, au Deep Learning et à l’OCR

La détection et la reconnaissance de texte dans les images sont des tâches courantes dans les applications de Computer Vision. Il peut s’agir par exemple de capturer la vidéo d’une scène de route depuis un véhicule en mouvement, de reconnaître les panneaux de signalisation dans la scène capturée et d’alerter le conducteur à leur sujet.

Il est possible d’associer la détection et la reconnaissance dans un processus à deux étapes : la première étape consiste à trouver les régions qui contiennent du texte et la seconde à reconnaître le texte dans ces régions.

Input image showing an accessible parking sign, connected to a detector, which outputs an image with predicted bounding boxes overlaid on the sign text, connected to a recognizer that outputs a list of the words recognized on the sign.

Les algorithmes de détection de texte utilisent les caractéristiques d’image locales et le Machine Learning ou le Deep Learning pour localiser ou segmenter le texte dans une image. Les exemples de Computer Vision Toolbox™ montrent comment utiliser l’analyse de blob, le détecteur de caractéristiques MSER (Maximally Stable Extremal Regions) et le modèle de Deep Learning CRAFT (Character Region Awareness For Text Detection) pour la détection de texte.

Une fois le texte détecté, les modèles de reconnaissance de texte basés sur le Machine Learning ou le Deep Learning traitent les régions de texte pour renvoyer le texte prédit. La fonction ocr utilise des modèles de langage préentraînés pour reconnaître le texte dans différentes langues. Il est également possible d’entraîner un modèle de langage personnalisé avec la fonction trainOCR. Pour plus d’informations, veuillez consulter Getting Started with OCR.

Applications

Image LabelerLabel images for computer vision applications

Fonctions

développer tout

ocrRecognize text using optical character recognition
ocrTextStore OCR results
visionSupportPackagesStart Installer to download, install, or uninstall Computer Vision Toolbox data
trainOCRTrain OCR model to recognize text in image (depuis R2023a)
evaluateOCREvaluate OCR results against ground truth (depuis R2023a)
ocrMetricsStore OCR quality metrics (depuis R2023a)
ocrTrainingOptionsOptions for training OCR model (depuis R2023a)
ocrTrainingDataCreate training data for OCR from ground truth (depuis R2023a)
quantizeOCRQuantize OCR model (depuis R2023a)
detectTextCRAFTDetect texts in images by using CRAFT deep learning model (depuis R2022a)
detectMSERFeaturesDetect MSER features
vision.BlobAnalysisProperties of connected regions
extractHOGFeaturesExtract histogram of oriented gradients (HOG) features

Rubriques

En savoir plus

Exemples présentés