Main Content

La traduction de cette page n'est pas à jour. Cliquez ici pour voir la dernière version en anglais.

Traitement audio avec Deep Learning

Enrichir des workflows de Deep Learning avec des applications de traitement audio et de la parole

Appliquez le Deep Learning à des applications de traitement audio et de la parole en utilisant Deep Learning Toolbox™ avec Audio Toolbox™. Pour des applications de traitement du signal, veuillez consulter Traitement du signal avec Deep Learning. Pour des applications de télécommunications, veuillez consulter Télécommunications avec Deep Learning.


Signal LabelerLabel signal attributes, regions, and points of interest, and extract features


développer tout

audioDatastoreDatastore for collection of audio files
audioDataAugmenterAugment audio data (depuis R2019b)
audioFeatureExtractorStreamline audio feature extraction (depuis R2019b)
openl3EmbeddingsExtract OpenL3 feature embeddings (depuis R2022a)
pitchnnEstimate pitch with deep learning neural network (depuis R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (depuis R2022a)
classifySoundClassify sounds in audio signal (depuis R2020b)
crepe(Not recommended) CREPE neural network (depuis R2021a)
crepePreprocessPreprocess audio for CREPE deep learning network (depuis R2021a)
crepePostprocessPostprocess output of CREPE deep learning network (depuis R2021a)
openl3(Not recommended) OpenL3 neural network (depuis R2021a)
openl3EmbeddingsExtract OpenL3 feature embeddings (depuis R2022a)
openl3PreprocessPreprocess audio for OpenL3 feature extraction (depuis R2021a)
pitchnnEstimate pitch with deep learning neural network (depuis R2021a)
vggish(Not recommended) VGGish neural network (depuis R2020b)
vggishEmbeddingsExtract VGGish feature embeddings (depuis R2022a)
vggishPreprocessPreprocess audio for VGGish feature extraction (depuis R2021a)
yamnet(Not recommended) YAMNet neural network (depuis R2020b)
yamnetGraphGraph of YAMNet AudioSet ontology (depuis R2020b)
yamnetPreprocessPreprocess audio for YAMNet classification (depuis R2021a)


VGGishVGGish embeddings extraction network (depuis R2022a)
VGGish EmbeddingsExtract VGGish embeddings (depuis R2022a)
YAMNetYAMNet sound classification network (depuis R2021b)
Sound ClassifierClassify sounds in audio signal (depuis R2021b)
OpenL3OpenL3 embeddings extraction network (depuis R2022b)
OpenL3 EmbeddingsExtract OpenL3 embeddings (depuis R2022b)
