La traduction de cette page n'est pas à jour. Cliquez ici pour voir la dernière version en anglais.
Détection d’objets
La détection d’objets est une technique de Computer Vision qui permet de localiser des objets dans des images ou des vidéos. Les algorithmes de détection d’objets utilisent généralement le Machine Learning ou le Deep Learning pour produire des résultats significatifs. Lorsqu’un être humain regarde une image ou une vidéo, il peut reconnaître et localiser des objets particuliers en quelques instants. La détection d’objets a pour but de reproduire cette intelligence avec un ordinateur. L’approche qui convient le mieux à la détection d’objets dépend de votre application et du problème à résoudre.
Les techniques de Deep Learning nécessitent un grand nombre d’images d’apprentissage labélisées. Il est donc recommandé d’utiliser un GPU pour réduire le temps d’apprentissage du modèle. Les approches de la détection d’objets basées sur le Deep Learning utilisent des réseaux de neurones à convolution (CNN ou ConvNet) tels que R-CNN et YOLO ou bien des détecteurs SSD (Single Shot Detection). Vous pouvez entraîner un détecteur d’objets personnalisé ou utiliser un détecteur préentraîné en tirant parti de l’apprentissage par transfert, une approche qui vous permet de commencer avec un réseau préentraîné, puis de l’affiner en fonction de votre application. Les réseaux de neurones à convolution nécessitent Deep Learning Toolbox™. L’apprentissage et la prédiction sont supportés sur un GPU compatible CUDA®. L’utilisation d’un GPU est recommandée et nécessite Parallel Computing Toolbox™. Pour plus d’informations, veuillez consulter Préférences de Computer Vision Toolbox et Parallel Computing Support in MathWorks Products (Parallel Computing Toolbox).
Les techniques de Machine Learning pour la détection d’objets comprennent l’algorithme ACF (Aggregate Channel Features), la classification SVM (Support Vector Machines) à l’aide des caractéristiques des histogrammes de gradient orienté (HOG) ainsi que l’algorithme de Viola-Jones pour la détection du visage ou du haut du corps humain. Vous pouvez commencer avec un détecteur d’objets préentraîné ou créer un détecteur personnalisé en fonction de votre application.
Applications
Image Labeler | Label images for computer vision applications |
Video Labeler | Label video for computer vision applications |
Fonctions
Blocs
Deep Learning Object Detector | Detect objects using trained deep learning object detector (depuis R2021b) |
Rubriques
En savoir plus
- Get Started with Object Detection Using Deep Learning
Perform object detection using deep learning neural networks such as YOLOX, YOLO v4, and SSD. - Choose an Object Detector
Compare object detection deep learning models, such as YOLOX, YOLO v4, RTMDet, and SSD. - Local Feature Detection and Extraction
Learn the benefits and applications of local feature detection and extraction. - Get Started with Cascade Object Detector
Train a custom classifier. - Point Feature Types
Choose functions that return and accept points objects for several types of features. - Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text. - Image Classification with Bag of Visual Words
Use the Computer Vision Toolbox™ functions for image category classification by creating a bag of visual words. - Systèmes de coordonnées
Définir les indices des pixels, les coordonnées spatiales, et les systèmes de coordonnées 3D
Données d’apprentissage pour la détection d’objets et la segmentation d’instances
- Get Started with the Image Labeler
Interactively label rectangular ROIs for object detection, pixels for semantic segmentation, polygons for instance segmentation, and scenes for image classification. - Get Started with the Video Labeler
Interactively label rectangular ROIs for object detection, pixels for semantic segmentation, polygons for instance segmentation, and scenes for image classification in a video or image sequence. - Datastores for Deep Learning (Deep Learning Toolbox)
Learn how to use datastores in deep learning applications. - Training Data for Object Detection and Semantic Segmentation
Create training data for object detection or semantic segmentation using the Image Labeler or Video Labeler. - Get Started with Image Preprocessing and Augmentation for Deep Learning
Preprocess data for deep learning applications with deterministic operations such as resizing, or augment training data with randomized operations such as random cropping.
Démarrer avec le Deep Learning
- Deep Learning in MATLAB (Deep Learning Toolbox)
Discover deep learning capabilities in MATLAB® using convolutional neural networks for classification and regression, including pretrained networks and transfer learning, and training on GPUs, CPUs, clusters, and clouds. - Pretrained Deep Neural Networks (Deep Learning Toolbox)
Learn how to download and use pretrained convolutional neural networks for classification, transfer learning and feature extraction.