Contenu principal

La traduction de cette page n'est pas à jour. Cliquez ici pour voir la dernière version en anglais.

Segmentation d’instances

Effectuer une segmentation d’instances avec des réseaux de Deep Learning préentraînés et entraîner des réseaux en utilisant l’apprentissage par transfert avec des données personnalisées

La segmentation d’instances est une technique de Computer Vision qui joue un rôle crucial dans les tâches exigeant une localisation précise des objets ainsi que l’identification des instances d’objet individuelles, comme l’imagerie médicale et la conduite autonome. Grâce à l’association des principes de la détection d’objets et de la segmentation sémantique, la segmentation d’instances permet d’affiner la compréhension des données visuelles en identifiant les instances d’objet individuelles et en les délimitant pixel par pixel. Utilisez la segmentation d’instances pour identifier, classer et séparer avec précision les objets individuels d’une image.

Vous pouvez effectuer des inférences sur une image avec un réseau de Deep Learning préentraîné ou entraîner un réseau avec l’apprentissage par transfert. L’apprentissage par transfert est une approche qui consiste à commencer avec un réseau préentraîné, puis à l’entraîner avec un jeu de données personnalisé en fonction de votre application. Il est possible de générer des données de vérité-terrain de manière interactive pour l’apprentissage en utilisant l’application Image Labeler, Video Labeler ou Ground Truth Labeler (Automated Driving Toolbox) pour labéliser les pixels et exporter les données labélisées. La segmentation d’instances nécessite Deep Learning Toolbox™. L’apprentissage et l’inférence supportent les GPU compatibles CUDA®. L’utilisation d’un GPU est recommandée et nécessite Parallel Computing Toolbox™. Pour plus d’informations, veuillez consulter Parallel Computing Support in MathWorks Products (Parallel Computing Toolbox).

Instance segmentation using SOLOv2: Left — segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — segmented image of PVC pipe connectors

Fonctions

développer tout

Configurer le réseau de segmentation d’instances

solov2Segment objects using SOLOv2 instance segmentation network (depuis R2023b)
maskrcnnDetect objects using Mask R-CNN instance segmentation (depuis R2021b)

Effectuer des inférences

segmentObjectsSegment objects using Mask R-CNN instance segmentation (depuis R2021b)
segmentObjectsSegment objects using SOLOv2 instance segmentation (depuis R2023b)

Charger les données d’apprentissage

boxLabelDatastoreDatastore for bounding box label data
groundTruthGround truth label data
imageDatastoreDatastore for image data
combineCombine data from multiple datastores

Entraîner des réseaux de segmentation d’instances

trainSOLOV2Train SOLOv2 network to perform instance segmentation (depuis R2023b)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (depuis R2022a)

Augmenter et prétraiter les données d’apprentissage

poly2maskConvert region of interest (ROI) polygon to region mask
bwboundariesTrace object boundaries in binary image
balanceBoxLabelsBalance bounding box labels for object detection
bboxcropCrop bounding boxes
bboxeraseRemove bounding boxes (depuis R2021a)
bboxresizeResize bounding boxes
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
imwarpApply geometric transformation to image
imcropCrop image
imresizeResize image
randomAffine2dCreate randomized 2-D affine transformation
centerCropWindow2dCreate rectangular center cropping window
randomWindow2dRandomly select rectangular region in image (depuis R2021a)
insertObjectMask Insert masks in image or video stream
insertObjectAnnotationAnnotate truecolor or grayscale image or video
insertShapeInsert shapes in image or video
showShapeDisplay shapes on image, video, or point cloud
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (depuis R2022b)
instanceSegmentationMetricsInstance segmentation quality metrics (depuis R2022b)
metricsByAreaEvaluate instance segmentation across object mask size ranges (depuis R2023b)
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (depuis R2024a)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (depuis R2024a)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (depuis R2024a)

Rubriques

En savoir plus

Préparer des données d’apprentissage pour la segmentation d’instances

Sélection d՚exemples