La traduction de cette page n'est pas à jour. Cliquez ici pour voir la dernière version en anglais.

Détection et reconnaissance de texte

Détecter et reconnaître du texte grâce à la détection et la description de caractéristiques, au Deep Learning et à l’OCR

La détection et la reconnaissance de texte dans les images sont des tâches courantes dans les applications de Computer Vision. Il peut s’agir par exemple de capturer la vidéo d’une scène de route depuis un véhicule en mouvement, de reconnaître les panneaux de signalisation dans la scène capturée et d’alerter le conducteur à leur sujet.

Il est possible d’associer la détection et la reconnaissance dans un processus à deux étapes : la première étape consiste à trouver les régions qui contiennent du texte et la seconde à reconnaître le texte dans ces régions.

Input image showing an accessible parking sign, connected to a detector, which outputs an image with predicted bounding boxes overlaid on the sign text, connected to a recognizer that outputs a list of the words recognized on the sign.

Les algorithmes de détection de texte utilisent les caractéristiques d’image locales et le Machine Learning ou le Deep Learning pour localiser ou segmenter le texte dans une image. Les exemples de Computer Vision Toolbox™ montrent comment utiliser l’analyse de blob, le détecteur de caractéristiques MSER (Maximally Stable Extremal Regions) et le modèle de Deep Learning CRAFT (Character Region Awareness For Text Detection) pour la détection de texte.

Une fois le texte détecté, les modèles de reconnaissance de texte basés sur le Machine Learning ou le Deep Learning traitent les régions de texte pour renvoyer le texte prédit. La fonction ocr utilise des modèles de langage préentraînés pour reconnaître le texte dans différentes langues. Il est également possible d’entraîner un modèle de langage personnalisé avec la fonction trainOCR. Pour plus d’informations, veuillez consulter Getting Started with OCR.

Applications

Image Labeler

Label images for computer vision applications

Fonctions

développer tout

Reconnaissance de texte

`ocr`	Recognize text using optical character recognition
`ocrText`	Store OCR results
`visionSupportPackages`	Start Installer to download, install, or uninstall Computer Vision Toolbox data

Apprentissage et évaluation

`trainOCR`	Train OCR model to recognize text in image (depuis R2023a)
`evaluateOCR`	Evaluate OCR results against ground truth (depuis R2023a)
`ocrMetrics`	Store OCR quality metrics (depuis R2023a)
`ocrTrainingOptions`	Options for training OCR model (depuis R2023a)
`ocrTrainingData`	Create training data for OCR from ground truth (depuis R2023a)

Quantification

quantizeOCR Quantize OCR model (depuis R2023a)

Détection de texte

`detectTextCRAFT`	Detect texts in images by using CRAFT deep learning model (depuis R2022a)
`detectMSERFeatures`	Detect MSER features
`vision.BlobAnalysis`	Properties of connected regions
`extractHOGFeatures`	Extract histogram of oriented gradients (HOG) features

Rubriques

En savoir plus

Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text.
Train Custom OCR Model
Train an optical character recognition (OCR) model to recognize custom text.
Install OCR Language Data Files
Support files for optical character recognition (OCR) languages.
Local Feature Detection and Extraction
Learn the benefits and applications of local feature detection and extraction.
Point Feature Types
Choose functions that return and accept points objects for several types of features.