Computer Vision Toolbox

Concevoir et tester des systèmes de Computer Vision, de vision 3D et de traitement vidéo

Computer Vision Toolbox™ contient des algorithmes, des fonctions et des applications pour concevoir et tester des systèmes de Computer Vision, de vision 3D et de traitement vidéo. Cet outil peut être utilisé pour la détection et le pistage d'objets ainsi que pour la détection, l'extraction et la correspondance de caractéristiques. Vous pouvez automatiser les workflows de calibrage pour les caméras monoscopiques, stéréoscopiques et fisheye. Pour la vision 3D, la toolbox supporte les opérations de SLAM visuel et sur nuages de points, la vision stéréo, la structure acquise à partir du mouvement et le traitement de nuages de points. Des applications interactives de Computer Vision automatisent les principaux workflows de labélisation de données de vérité terrain et de calibrage de caméra.

Il est possible d'entraîner des détecteurs d'objets personnalisés avec des algorithmes de Deep Learning et de Machine Learning tels que YOLO v2, SSD et ACF. Pour la segmentation sémantique et la segmentation d'instances, vous pouvez utiliser des algorithmes de Deep Learning comme U-Net et Mask R-CNN. La toolbox contient des algorithmes de détection d'objets et de segmentation permettant l'analyse des images trop volumineuses pour être stockées en mémoire. Des modèles pré-entraînés vous permettent de détecter les visages, les piétons et d'autres objets courants.

Vous pouvez accélérer vos algorithmes en les exécutant sur des GPU et des processeurs multicœurs. Les algorithmes de cette toolbox supportent la génération de code C/C++ pour l'intégration à du code existant, le prototypage sur PC et le déploiement de systèmes de vision embarqués.

En savoir plus :

Deep Learning et Machine Learning

Détectez, identifiez et segmentez des objets avec le Deep Learning et le Machine Learning.

Détection et reconnaissance d'objets

Entraînez, évaluez et déployez des détecteurs d'objets comme YOLO v2, Faster R-CNN, ACFR et Viola-Jones. Effectuez une reconnaissance d'objets avec un modèle de sac de mots visuels et la reconnaissance optique de caractères (OCR). Utilisez des modèles pré-entraînés pour détecter les visages, les piétons et d'autres objets courants.

Détection d'objets avec Faster R-CNN.

Segmentation sémantique

Segmentez les images et les volumes 3D par classification des pixels et des voxels avec des réseaux tels que SegNet, FCN, U-Net et DeepLab v3+. Utilisez la segmentation d'instances pour générer des cartes de segmentation et détecter des instances uniques d'objets.

Segmentation d'instances avec Mask R-CNN.

Labélisation de données de vérité-terrain

Automatisez la labélisation pour la détection d'objets, la segmentation sémantique, la segmentation d'instances et la classification des scènes avec les applications Video Labeler et Image Labeler.

Labélisation de données de vérité-terrain avec l'application Video Labeler.

Calibrage de caméra

Estimez les paramètres intrinsèques, extrinsèques et de distorsion optique des caméras.

Calibrage de caméra unique

Automatisez la détection du damier et calibrez les caméras à sténopé et fisheye avec l'application Camera Calibrator.

Calibrage de caméra stéréo

Calibrez des paires stéréoscopiques pour calculer la profondeur et reconstruisez des scènes 3D.

SLAM visuel et vision 3D

Réalisez l'extraction de la structure 3D d'une scène à partir de plusieurs vues 2D. Estimez le mouvement et la pose de la caméra avec une odométrie visuelle. Affinez les estimations de pose avec le SLAM visuel.

Structure multi-vues acquise à partir d'un mouvement.

Détection et mise en correspondance de caractéristiques pour le SLAM visuel.

Vision stéréo

Estimez la profondeur et reconstruisez des scènes 3D avec des paires de caméras stéréoscopiques.

Estimation des profondeurs relatives des points dans une scène avec la vision stéréo.

Traitement de nuages de points lidar et 3D

Segmentez, groupez en cluster, sous-échantillonnez, débruitez, recalez et ajustez des formes géométriques avec des données en nuages de points LiDAR ou 3D. Lidar Toolbox™ propose des fonctionnalités supplémentaires pour concevoir, analyser et tester les systèmes de traitement de données LiDAR.

E/S LiDAR et nuage de points

Lisez, écrivez et affichez des nuages de points à partir de fichiers, de systèmes LiDAR et de capteurs RGB-D.

Utilisation d'un outil de visualisation de nuage de points pour des nuages de point en streaming.

Recalage des nuages de points

Recalez les nuages de points 3D à l'aide d'algorithmes NDT (Normal-Distributions Transform), ICP (Iterative Closest Point) et CPD (Coherent Point Drift).

Recalage et montage d'une série de nuages de points.

Segmentation et ajustement de formes

Segmentez les nuages de points en clusters et ajustez les formes géométriques aux nuages de points. Segmentez le plan de sol dans les données LiDAR pour des applications de conduite autonome et de robotique.

Identification de clusters dans un nuage de points avec la segmentation.

Détection, extraction et mise en correspondance de caractéristiques

Utilisez les workflows basés sur les caractéristiques pour la détection d'objets, le recalage d'images et la reconnaissance d'objets.

Détection d'un objet dans une scène encombrée en utilisant la détection, l'extraction et la mise en correspondance de points d'intérêt.

Recalage d'images basé sur les caractéristiques

Faites correspondre les caractéristiques de plusieurs images afin d'estimer les transformations géométriques entre les images et recaler les séquences d'images.

Panorama créé par recalage basé sur les caractéristiques.

Pistage d'objets et estimation du mouvement

Évaluez les mouvements et pistez des objets sur des séquences d'images ou de vidéo.

Estimation du mouvement

Estimez un mouvement entre deux images d'une vidéo en utilisant un flux optique, une correspondance de blocs et de modèles.

Détection d'objets en mouvement avec une caméra stationnaire.

Interface OpenCV

Intégrez des projets et des fonctions basés sur OpenCV dans MATLAB et Simulink.

Génération de code

Intégrez le développement d'algorithmes de Computer Vision aux workflows de prototypage rapide, d'implémentation et de vérification.