Main Content

Reconnaissance, détection d’objets et segmentation sémantique

Reconnaissance, classification, segmentation sémantique d’images, segmentation d’instances, détection d’objets à l’aide de caractéristiques et détection d’objets avec le Deep Learning en utilisant CNN, YOLO et SSD

Computer Vision Toolbox™ supporte plusieurs approches de la classification d’images, de la détection d’objets, de la segmentation sémantique, de la segmentation d’instances et de la reconnaissance, notamment :

  • Deep Learning et réseaux de neurones à convolution (CNN)

  • Modèle de sac de caractéristiques (BoF)

  • Correspondance de modèle

  • Analyse de blob

  • Algorithme de Viola-Jones

Un CNN est une architecture de Deep Learning couramment utilisée qui apprend automatiquement les représentations de caractéristiques utiles directement à partir d’images. Un modèle de sac de caractéristiques (BoF) encode les caractéristiques des images dans une représentation compacte qui convient particulièrement à la classification et la recherche d’images. La correspondance de modèle utilise une petite image, ou modèle, pour trouver des régions correspondantes dans une image plus grande. L’analyse de blob utilise la segmentation et les propriétés des blobs pour identifier des objets particuliers. L’algorithme de Viola-Jones utilise des caractéristiques pseudo-Haar ainsi qu’une cascade de classificateurs pour identifier des objets tels que des visages, des nez et des yeux. Il est possible d’entraîner le classificateur à reconnaître d’autres objets.

Catégories

  • Détection d’objets
    Classification, détection d’objets, apprentissage par transfert avec des réseaux de neurones à convolution (CNN ou ConvNet) et création de détecteurs personnalisés
  • Segmentation sémantique
    Segmentation sémantique d’images
  • Segmentation d’instances
    Effectuer une segmentation d’instances avec des réseaux de Deep Learning préentraînés et entraîner des réseaux en utilisant l’apprentissage par transfert avec des données personnalisées
  • Classification d’images
    Créer un classificateur d’images basé sur un modèle de Vision Transformer ou de sac de mots visuels
  • Inspection visuelle automatisée
    Automatiser les tâches de contrôle qualité avec des méthodes de détection et de localisation d’anomalies
  • Détection et reconnaissance de texte
    Détecter et reconnaître du texte grâce à la détection et la description de caractéristiques, au Deep Learning et à l’OCR
  • Détection de points clés
    Détecter les points clés dans des objets avec des réseaux de neurones à convolution (CNN)
  • Classification de vidéos
    Classer des vidéos et reconnaître des activités avec le Deep Learning