Main Content

Segmentation d’instances

Effectuer une segmentation d’instances avec des réseaux de Deep Learning préentraînés et entraîner des réseaux en utilisant l’apprentissage par transfert avec des données personnalisées

La segmentation d’instances est une technique de Computer Vision qui joue un rôle crucial dans les tâches exigeant une localisation précise des objets ainsi que l’identification des instances d’objet individuelles, comme l’imagerie médicale et la conduite autonome. Grâce à l’association des principes de la détection d’objets et de la segmentation sémantique, la segmentation d’instances permet d’affiner la compréhension des données visuelles en identifiant les instances d’objet individuelles et en les délimitant pixel par pixel. Utilisez la segmentation d’instances pour identifier, classer et séparer avec précision les objets individuels d’une image.

Vous pouvez effectuer des inférences sur une image avec un réseau de Deep Learning préentraîné ou entraîner un réseau avec l’apprentissage par transfert. L’apprentissage par transfert est une approche qui consiste à commencer avec un réseau préentraîné, puis à l’entraîner avec un jeu de données personnalisé en fonction de votre application. Il est possible de générer des données de vérité-terrain de manière interactive pour l’apprentissage en utilisant l’application Image Labeler, Video Labeler ou Ground Truth Labeler (Automated Driving Toolbox) pour labéliser les pixels et exporter les données labélisées. La segmentation d’instances nécessite Deep Learning Toolbox™. L’apprentissage et l’inférence supportent les GPU compatibles CUDA®. L’utilisation d’un GPU est recommandée et nécessite Parallel Computing Toolbox™. Pour plus d’informations, veuillez consulter Parallel Computing Support in MathWorks Products (Parallel Computing Toolbox).

Instance segmentation using SOLOv2: Left — segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — segmented image of PVC pipe connectors

Fonctions

développer tout

Configurer le réseau de segmentation d’instances

solov2Segment objects using SOLOv2 instance segmentation network (depuis R2023b)
maskrcnnDetect objects using Mask R-CNN instance segmentation (depuis R2021b)

Effectuer des inférences

segmentObjectsSegment objects using Mask R-CNN instance segmentation (depuis R2021b)
segmentObjectsSegment objects using SOLOv2 instance segmentation (depuis R2023b)

Charger les données d’apprentissage

boxLabelDatastoreDatastore for bounding box label data (depuis R2019b)
groundTruthGround truth label data
imageDatastoreDatastore for image data
combineCombine data from multiple datastores

Entraîner des réseaux de segmentation d’instances

trainSOLOV2Train SOLOv2 network to perform instance segmentation (depuis R2023b)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (depuis R2022a)

Augmenter et prétraiter les données d’apprentissage

poly2maskConvert region of interest (ROI) polygon to region mask
bwboundariesTrace object boundaries in binary image
balanceBoxLabelsBalance bounding box labels for object detection (depuis R2020a)
bboxcropCrop bounding boxes (depuis R2019b)
bboxeraseRemove bounding boxes (depuis R2021a)
bboxresizeResize bounding boxes (depuis R2019b)
bboxwarpApply geometric transformation to bounding boxes (depuis R2019b)
bbox2pointsConvert rectangle to corner points list
imwarpApply geometric transformation to image
imcropCrop image
imresizeResize image
randomAffine2dCreate randomized 2-D affine transformation (depuis R2019b)
centerCropWindow2dCreate rectangular center cropping window (depuis R2019b)
randomWindow2dRandomly select rectangular region in image (depuis R2021a)
insertObjectMask Insert masks in image or video stream (depuis R2020b)
insertObjectAnnotationAnnotate truecolor or grayscale image or video
insertShapeInsert shapes in image or video
showShapeDisplay shapes on image, video, or point cloud (depuis R2020b)
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (depuis R2022b)
instanceSegmentationMetricsInstance segmentation quality metrics (depuis R2022b)
metricsByAreaEvaluate instance segmentation across object mask size ranges (depuis R2023b)
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (depuis R2024a)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (depuis R2024a)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (depuis R2024a)

Rubriques

En savoir plus

Préparer des données d’apprentissage pour la segmentation d’instances