Audio Toolbox
Concevoir et analyser des systèmes de traitement audio, acoustique et de la parole
Audio Toolbox™ propose des outils pour le traitement audio, l'analyse de la parole et les mesures acoustiques. Elle comprend des algorithmes pour le traitement du signal audio (comme l'égalisation et le contrôle de la plage dynamique) ainsi que pour les mesures acoustiques (comme l'estimation de la réponse impulsionnelle, le filtrage par bandes d'octave et la pondération perceptuelle). Des algorithmes sont également proposés pour l'extraction de caractéristiques audio et de parole (telles que les MFCC et le pitch) et pour la transformation du signal audio (banc de filtres gammatone et mel-spectrogramme, par exemple).
Les applications contenues dans la toolbox supportent les tests d'algorithmes temps réel, les mesures de réponse impulsionnelle et la labellisation des signaux audio. La toolbox contient des interfaces streaming pour les cartes son CoreAudio, ALSA, WASAPI et ASIO et pour les dispositifs MIDI, ainsi que des outils pour générer et héberger des plugins audio standards au format VST ou Audio Unit, par exemple.
Avec Audio Toolbox, vous pouvez importer, étiqueter et augmenter les jeux de données audio, ou encore extraire des caractéristiques et transformer des signaux pour le Machine Learning et le Deep Learning. Vous pouvez prototyper des algorithmes de traitement audio en temps réel en utilisant du streaming audio à faible latence, tout en réglant des paramètres et en visualisant des signaux. Vous pouvez également valider vos algorithmes en les transformant en plugin audio afin de les exécuter dans des applications hôtes externes, comme des Digital Audio Workstations. L'hébergement de plugins vous permet d'utiliser des plugins audio externes comme des objets courants pour traiter des tableaux MATLAB®. La connectivité avec des cartes son vous permet de réaliser des mesures personnalisées sur des systèmes acoustiques et des signaux audio temps réel.
En savoir plus :
Connectivité à des drivers audio standards
Lisez et écrivez des échantillons audio depuis et vers des cartes son (USB ou Thunderbolt™, par exemple) avec des drivers audio standards (tels que ASIO, WASAPI, CoreAudio ou ALSA) sur Windows®, Mac® et Linux®.
Streaming audio multicanal à faible latence
Traitez de l'audio en temps réel dans MATLAB avec une latence aller-retour de quelques millisecondes.
Machine Learning et Deep Learning
Étiquetez, augmentez, créez et intégrez des jeux de données de parole et audio, extrayez des caractéristiques et calculez des transformations temps-fréquence. Développez des analyses de parole et audio avec Statistics and Machine Learning Toolbox™, Deep Learning Toolbox™ ou d'autres outils de Machine Learning.
Modèles de Deep Learning pré-entraînés
Utilisez des modèles de Deep Learning courants pré-entraînés avec des jeux de données audio volumineux pour exécuter des tâches de traitement audio complexes. Classifiez les événements audio dans des enregistrements audio avec Yamnet et effectuez l'extraction d'embeddings audio avec VGGish.
Extraction de caractéristiques audio et de parole
Réalisez l'extraction des caractéristiques de bas niveau pour les analyses audio et de parole, notamment les coefficients cepstraux MFCC (Mel-Frequency Cepstral Coefficients), les coefficients cepstraux gammatone (GTCC), le pitch, l'harmonicité et des descripteurs spectraux. Alimentez des architectures de Deep Learning travaillant sur des séries temporelles, comme celles basées sur des couches LSTM.
Transformations temps-fréquence
Transformez des signaux en représentations temps-fréquence avec une transformée en cosinus discrète modifiée (MDCT), une transformée de Fourier à court terme (STFT) ou le mel-spectrogramme (plus compact). Décomposez des signaux avec des bandes de fréquence espacées sur le plan perceptif qui utilisent des bancs de filtres gammatone. Alimentez des modèles de Deep Learning travaillant sur des données à deux dimensions, comme ceux basés sur couches CNN.
Labelliser et annoter des jeux de données audio
Attribuez manuellement et automatiquement des étiquettes et des annotations de vérité terrain aux enregistrements audio et aux jeux de données. Détectez les régions de parole dans les signaux audio. Automatisez la transcription de parole en texte avec les services cloud de reconnaissance vocale.
Travailler avec des jeux de données audio volumineux
Indexez et lisez depuis d'importantes collections d'enregistrements audio avec audioDatastore
. Séparez aléatoirement des listes de fichiers audio selon les étiquettes. Parallélisez les tâches de traitement avec des tall arrays pour l'augmentation de données, les transformations temps-fréquence et l'extraction de caractéristiques.
Augmenter et synthétiser les jeux de données audio et de parole
Mettez en place des pipelines d'augmentation aléatoire des données en utilisant des combinaisons de décalage de pitch, d'étirement temporel et d'autres effets de traitement audio. Créez des enregistrements de parole synthétiques à partir de textes en utilisant des services cloud de synthèse vocale.
Égaliseurs et filtres audio
Modélisez et appliquez des filtres EQ paramétriques, EQ graphiques, plateaux et de pente variable. Concevez et simulez des filtres crossover numériques, par bandes d'octave ou d'octaves fractionnées.
Contrôle et effets de la plage dynamique
Modélisez et appliquez des algorithmes de traitement de la plage dynamique tels qu'un compresseur, un limiteur, un expanseur et une noise gate. Ajoutez une réverbération artificielle avec des modèles paramétriques récursifs.
Simulation système avec une modélisation par blocs
Concevez et simulez des modèles de systèmes avec des bibliothèques de blocs de traitement audio pour Simulink®. Réglez les paramètres et visualisez le comportement du système grâce à des contrôles interactifs et des tracés dynamiques.
Réglage des paramètres en temps réel via des interfaces utilisateur
Créez automatiquement des interfaces utilisateur pour les paramètres réglables d'algorithmes de traitement audio. Testez des algorithmes individuels avec l'application Audio Test Bench et réglez des paramètres dans des programmes en cours d'exécution avec des contrôles interactifs auto-générés.
Connectivité MIDI pour le contrôle de paramètres et l'échange de messages
Modifiez des paramètres d'algorithmes MATLAB de manière interactive en utilisant les surfaces de contrôle MIDI. Contrôlez du hardware externe ou répondez aux événements en envoyant et en recevant tout type de messages MIDI.
Mesures et analyses standardisées
Appliquez des mesures de niveau de pression acoustique (SPL) et de niveau sonore à des signaux temps réel ou enregistrés. Analysez des signaux avec des filtres par bandes d'octave ou d'octaves fractionnées. Appliquez des filtres de pondération A, C ou K conformes aux normes à des enregistrements bruts.
Mesure de la réponse impulsionnelle
Mesurez les réponses impulsionnelles et en fréquence de systèmes audio et acoustiques avec des séquences MLS (maximum-length sequences) et des sinus de fréquence glissants (ESS). Commencez avec l'application Impulse Response Measurer. Automatisez les mesures en générant de manière programmatique des signaux d'excitation et en estimant les réponses du système.
Convolution efficace avec des réponses impulsionnelles de salles
Convoluez efficacement des signaux avec des réponses impulsionnelles longues avec des implémentations overlap-and-add et overlap-and-save dans le domaine fréquentiel. Trouvez le bon compromis entre latence et vitesse de calcul avec le partitionnement automatique de la réponse impulsionnelle.
Audio spatial
Codez et décodez différents formats ambisoniques. Interpolez des fonctions de transfert relatives à la tête (HRTF) échantillonnées spatialement.
Génération de plugins audio
Générez des plugins VST, des plugins AU et des plugins exécutables autonomes directement depuis le code MATLAB sans avoir à concevoir manuellement les interfaces utilisateur. Générez des projets JUCE C++ prêts à l'emploi pour un prototypage de plugins plus avancé (nécessite MATLAB Coder™).
Hébergement de plugins audio externes
Utilisez des plugins AU et VST externes comme des objets MATLAB courants. Modifiez les paramètres des plugins et traitez des tableaux MATLAB de manière programmatique. Automatisez également les associations des paramètres de plugins avec les interfaces utilisateur et les commandes MIDI. Hébergez des plugins générés depuis votre code MATLAB pour une exécution plus efficace.
Cartes mobiles et low-cost
Prototypez des designs de traitement audio sur Raspberry Pi™ avec des interfaces audio multicanal, intégrées ou externes. Créez des panneaux de contrôle interactifs sous forme d'applications mobiles pour les dispositifs iOS ou Android®.
Systèmes à latence zéro
Prototypez des designs de traitement audio avec des entrées et des sorties à échantillon unique pour le contrôle du bruit adaptatif, la validation de dispositifs auditifs ou d'autres applications nécessitant une latence DSP aller-retour minimale. Ciblez automatiquement des systèmes audio Speedgoat et des cartes ST Discovery directement à partir de modèles Simulink.
Classification Son YAMNet
Classifiez des enregistrements de sons avec le Deep Learning (Deep Learning Toolbox requise)
VGGish Audio Embeddings
Réalisez l'extraction des caractéristiques audio de haut niveau avec le Deep Learning (Deep Learning Toolbox requise)
Coefficients cepstraux généralisés et caractéristiques delta
Calculez les MFCC, GTCC, BFCC et autres types de coefficients cepstraux, les spectrogrammes audio et les caractéristiques delta
Analyse par bande d'octave pour fréquences inaudibles
Analysez les signaux avec des filtres d'octave améliorés avec octaveFilter, octaveFilterBank et splMeter
Fluctuation acoustique
Mesurez la fluctuation acoustique perçue
Accélération GPU pour l'extraction de caractéristiques
Accélérez des fonctions supplémentaires pour l'extraction de caractéristiques à l'aide de cartes GPU compatibles (Parallel Computing Toolbox requise)
Consultez les notes de version pour en savoir plus sur ces fonctionnalités et les fonctions correspondantes.