Computer Vision Toolbox

Concevoir et tester des systèmes de Computer Vision, de vision 3D et de traitement vidéo

 

Computer Vision Toolbox™ contient des algorithmes, des fonctions et des applications pour concevoir et tester des systèmes de Computer Vision, de vision 3D et de traitement vidéo. Cet outil peut être utilisé pour la détection et le pistage d'objets ainsi que pour la détection, l'extraction et la correspondance de caractéristiques. Pour la vision 3D, la toolbox supporte le calibrage de caméras unique, stéréo et fisheye, la vision stéréo, la reconstruction 3D et le traitement de nuages de points lidar et 3D. Des applications interactives de computer vision automatisent les principaux workflows de labélisation de données de vérité terrain et de calibrage de caméra.

Il est possible d'entraîner des détecteurs d'objets personnalisés avec des algorithmes de Deep Learning et de Machine Learning tels que YOLO v2, Faster R-CNN et ACF. Pour la segmentation sémantique, vous pouvez utiliser des algorithmes de Deep Learning tels que SegNet, U-Net et DeepLab. Des modèles pré-entraînés vous permettent de détecter les visages, les piétons et d'autres objets courants.

Vous pouvez accélérer vos algorithmes en les exécutant sur des GPU et des processeurs multicœurs. La plupart des algorithmes de cette toolbox supportent la génération de code C/C++ pour l'intégration à du code existant, le prototypage sur PC et le déploiement de systèmes de vision embarqués.

En savoir plus :

Deep Learning et Machine Learning

Détectez, identifiez et segmentez des objets avec le Deep Learning et le Machine Learning.

Détection et reconnaissance d'objets

La toolbox propose des infrastructures d'apprentissage, d'évaluation et de déploiement de détecteurs d'objets, tels que YOLO v2, Faster R-CNN, ACFR et Viola-Jones. La capacité de reconnaissance d'objets inclut un modèle de sac de mots visuels et la reconnaissance optique de caractères (OCR). Les modèles pré-entraînés détectent les visages, les piétons et d'autres objets courants.

Détection d'objets avec Faster R-CNN. 

Segmentation sémantique

Segmentez les images et les volumes 3D par classification des pixels et des voxels à l'aide de réseaux tels que SegNet, FCN, U-Net et DeepLab v3+.

Labélisation de données de vérité terrain

Automatisez la labélisation pour la détection d'objets, la segmentation sémantique et la classification des scènes avec les applications Video Labeler et Image Labeler.

Labélisation de données de vérité terrain avec l'application Video Labeler.

Traitement de nuages de points lidar et 3D

Segmentez, groupez, sous-échantillonnez, débruitez, recalez et ajustez des formes géométriques avec des données en nuages de points lidar ou 3D. Lidar Toolbox™ propose des fonctionnalités supplémentaires pour concevoir, analyser et tester les systèmes de traitement de données lidar.

E/S lidar et nuage de points

Accédez en lecture et en écriture aux nuages de points à partir de fichiers, de capteurs lidar ou de capteurs RGB-D.

Recalage de nuages de points

Recalez les nuages de points 3D à l'aide d'algorithmes NDT (Normal-Distributions Transform), ICP (Iterative Closest Point) et CPD (Coherent Point Drift).

Recalage et montage d'une série de nuages de points.

Segmentation et ajustement de formes

Segmentez les nuages de points en clusters et ajustez les formes géométriques aux nuages de points. Segmentez le plan de sol dans les données lidar pour des applications de conduite autonome et de robotique.

Nuage de points lidar segmenté.

Calibrage de caméra

Estimez les paramètres intrinsèques, extrinsèques et de distorsion optique des caméras.

Calibrage de caméra unique

Automatisez la détection du damier et calibrez les caméras à sténopé et fisheye à l'aide de l'application Camera Calibrator.

Calibrage de caméra stéréo

Calibrez un couple stéréoscopique pour calculer la profondeur et reconstruisez des scènes 3D.

Application Stereo Camera Calibrator.

Vision 3D et vision stéréo

Réalisez l'extraction de la structure 3D d'une scène à partir de plusieurs vues 2D. Estimez le mouvement et la pose de la caméra avec une odométrie visuelle.

Vision stéréo

Estimez la profondeur et reconstruisez une scène 3D avec une paire de caméras stéréoscopiques.

Carte de disparité stéréo représentant les profondeurs relatives.

Détection, extraction et mise en correspondance de caractéristiques

Découvrez les workflows standard pour la détection d'objets, le recalage d'images et la reconnaissance d'objets, basés sur les caractéristiques.

Détection d'un objet dans une scène encombrée en utilisant la détection, l'extraction et la mise en correspondance de points d'intérêt.

Recalage d'images basé sur les caractéristiques

Faites correspondre les caractéristiques de plusieurs images afin d'estimer les transformations géométriques entre les images et recaler les séquences d'images.

Panorama créé par recalage basé sur les caractéristiques.

Pistage d'objets et estimation du mouvement

Évaluez les mouvements et pistez des objets sur des séquences d'images ou de vidéo.

Estimation du mouvement

Estimez un mouvement entre deux images d'une vidéo en utilisant un flux optique, une correspondance de blocs et de modèles.

Détection d'objets en mouvement à l'aide d'une caméra stationnaire.

Interface OpenCV

Interfacez MATLAB et Simulink avec des projets et des fonctions basés sur OpenCV

Génération de code

Intégrez le développement d'algorithmes aux workflows de prototypage rapide, d'implémentation et de vérification.

Nouveautés

Mask-RCNN

Entraînez des réseaux Mask-RCNN pour la segmentation des instances avec le Deep Learning

SLAM (Simultaneous Localization and Mapping) visuel

Gérez des points en représentation 3D et leurs correspondances de projection sur des points d'image 2D

Estimation de la pose des AprilTag

Détectez et estimez la pose des AprilTag dans une image

Recalage des nuages de points

Recalez des nuages de points en utilisant la corrélation de phase pour les applications SLAM

Détection de fermeture de boucle à partir de nuages de points

Descripteur de caractéristique de nuages de points pour la détection de fermeture de boucle SLAM

Consultez les notes de version pour en savoir plus sur ces fonctionnalités et les fonctions correspondantes.