Main Content

Traitement audio

Enrichir des workflows de Deep Learning avec des applications de traitement audio et de la parole

Appliquez le Deep Learning à des applications de traitement audio et de la parole en utilisant Deep Learning Toolbox™ avec Audio Toolbox™. Pour des applications de traitement du signal, veuillez consulter Traitement du signal. Pour des applications de télécommunications, veuillez consulter Télécommunications.

Applications

Signal LabelerLabel signal attributes, regions, and points of interest, and extract features

Fonctions

développer tout

audioDatastoreDatastore for collection of audio files
audioDataAugmenterAugment audio data (depuis R2019b)
audioFeatureExtractorStreamline audio feature extraction (depuis R2019b)
openl3EmbeddingsExtract OpenL3 feature embeddings (depuis R2022a)
pitchnnEstimate pitch with deep learning neural network (depuis R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (depuis R2022a)
audioPretrainedNetworkPretrained audio neural networks (depuis R2024a)
classifySoundClassify sounds in audio signal (depuis R2020b)
pitchnnEstimate pitch with deep learning neural network (depuis R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (depuis R2022a)
openl3EmbeddingsExtract OpenL3 feature embeddings (depuis R2022a)
detectspeechnnDetect boundaries of speech in audio signal using AI (depuis R2023a)
separateSpeakersSeparate signal by speakers (depuis R2023b)

Blocs

développer tout

VGGishVGGish embeddings extraction network (depuis R2022a)
VGGish EmbeddingsExtract VGGish embeddings (depuis R2022a)
YAMNetYAMNet sound classification network (depuis R2021b)
Sound ClassifierClassify sounds in audio signal (depuis R2021b)
OpenL3OpenL3 embeddings extraction network (depuis R2022b)
OpenL3 EmbeddingsExtract OpenL3 embeddings (depuis R2022b)
CREPECREPE deep pitch estimation neural network (depuis R2023a)
Deep Pitch EstimatorEstimate pitch with CREPE deep learning neural network (depuis R2023a)

Rubriques