Audio Toolbox
Concevoir et analyser des systèmes de traitement audio, acoustique et de la parole
Vous avez des questions ? Contacter un commercial.
Vous avez des questions ? Contacter un commercial.
Audio Toolbox propose des outils pour le traitement audio, l'analyse de la parole et les mesures acoustiques. Elle comprend des algorithmes pour le traitement du signal audio tels que l'égalisation et l'étirement temporel, pour l'estimation des métriques acoustiques comme l'intensité et l'acuité sonores, ainsi que pour l'extraction de caractéristiques audio telles que les MFCC et le pitch. Elle offre également des modèles avancés de Machine Learning, notamment des i-vectors et des réseaux de Deep Learning pré-entraînés tels que VGGish et CREPE. Les applications de la toolbox supportent les tests d'algorithmes en temps réel, les mesures de réponse impulsionnelle et la labellisation des signaux audio. La toolbox contient également des interfaces streaming pour des cartes son dont les cartes ASIO et CoreAudio, des dispositifs MIDI, et des outils pour générer et héberger des plugins audio au format VST et Audio Unit.
Avec Audio Toolbox, vous pouvez importer, étiqueter et augmenter des jeux de données audio, ou encore extraire des caractéristiques pour entraîner des modèles de Machine Learning et Deep Learning. Les modèles pré-entraînés proposés peuvent être appliqués à des enregistrements audio pour une analyse sémantique de haut niveau.
Vous pouvez prototyper des algorithmes de traitement audio en temps réel ou réaliser des mesures acoustiques personnalisées en diffusant de l'audio à faible latence en streaming depuis et vers la carte son. Vous pouvez valider vos algorithmes en les transformant en plugin audio afin de les exécuter dans des applications hôtes externes, comme des Digital Audio Workstations. L'hébergement de plugins vous permet d'utiliser des plugins audio externes en tant qu'objets MATLAB courants.
Lisez et écrivez des échantillons audio depuis et vers des cartes son (USB ou Thunderbolt™, par exemple) avec des drivers audio standard (tels que ASIO, WASAPI, CoreAudio ou ALSA) sur Windows®, Mac® et Linux®.
Traitez de l'audio en temps réel dans MATLAB avec une latence aller-retour de quelques millisecondes.
Étiquetez, augmentez, créez et intégrez des jeux de données de parole et audio, faites l'extraction des caractéristiques et calculez des transformations temps-fréquence. Développez des analyses de parole et audio avec Statistics and Machine Learning Toolbox, Deep Learning Toolbox ou d'autres outils de Machine Learning.
Tirez parti du Deep Learning pour effectuer des tâches complexes de traitement du signal et extraire des embeddings audio avec une seule ligne de code. Accédez à des réseaux pré-entraînés éprouvés tels que YAMNet, VGGish, CREPE et OpenL3, puis appliquez-les grâce à des fonctions pré-configurées d'extraction de caractéristiques.
Transformez des signaux en représentations temps-fréquence comme les spectrogrammes Mel, Bark et ERB. Calculez les coefficients cepstraux tels que les MFCC (Mel-Frequency Cepstral Coefficients) et les GTCC (Gammatone Cepstral Coefficients), ainsi que des caractéristiques scalaires telles que le pitch, l'harmonicité et des descripteurs spectraux. Réalisez l'extraction des caractéristiques et des embeddings audio de haut niveau en utilisant des modèles de Deep Learning pré-entraînés (VGGisg, OpenL3) et le système i-vector. Accélérez l'extraction de caractéristiques avec des cartes graphiques compatibles.
Entraînez des algorithmes de Machine Learning courants avec vos jeux de données audio. Utilisez des systèmes de modèles éprouvés, tels que i-vectors, pour des applications comme l'identification et la vérification du locuteur. Apprenez, à partir d'exemples fonctionnels, à concevoir et entraîner des réseaux de neurones et des couches avancés pour des applications audio, de parole et acoustique.
Lisez, partitionnez et prétraitez des collections d'enregistrements audio volumineuses. Annotez manuellement des signaux audio avec des applications. Identifiez et segmentez automatiquement les régions d'intérêt à l'aide de modèles de Machine Learning pré-entrainés.
Mettez en place des pipelines d'augmentation aléatoire des données en utilisant des combinaisons de décalage de pitch, d'étirement temporel et d'autres effets de traitement audio. Créez des enregistrements de parole synthétiques à partir de textes en utilisant des services cloud de synthèse vocale.
Modélisez et appliquez des filtres d'égalisation paramétriques, d'égalisation graphiques, plateaux et de pente variable. Concevez et simulez des filtres crossover numériques, par bandes d'octave ou d'octaves fractionnées.
Modélisez et appliquez des algorithmes de traitement de la plage dynamique tels qu'un compresseur, un limiteur, un expanseur et une noise gate. Ajoutez une réverbération artificielle avec des modèles paramétriques récursifs.
Concevez et simulez des modèles de systèmes avec des bibliothèques de blocs de traitement audio pour Simulink. Réglez les paramètres et visualisez le comportement du système grâce à des contrôles interactifs et des tracés dynamiques.
Créez automatiquement des interfaces utilisateur pour les paramètres réglables d'algorithmes de traitement audio. Testez des algorithmes individuels avec l'application Audio Test Bench et réglez des paramètres dans des programmes en cours d'exécution avec des contrôles interactifs auto-générés.
Modifiez des paramètres d'algorithmes MATLAB de manière interactive en utilisant les surfaces de contrôle MIDI. Contrôlez du hardware externe ou répondez aux événements en envoyant et en recevant tout type de messages MIDI.
Appliquez des mesures de niveau de pression acoustique (SPL) et de niveau sonore à des signaux temps réel ou enregistrés. Analysez des signaux avec des filtres par bandes d'octave ou d'octaves fractionnées. Appliquez des filtres de pondération A, C ou K conformes aux normes à des enregistrements bruts. Mesurez l'acuité, les irrégularités et l'intensité des fluctuations acoustiques.
Mesurez les réponses impulsionnelles et en fréquence de systèmes audio et acoustiques avec des séquences MLS (maximum-length sequences) et des sinus de fréquence glissante (ESS). Commencez avec l'application Impulse Response Measurer. Automatisez les mesures en générant de manière programmatique des signaux d'excitation et en estimant les réponses du système.
Convoluez efficacement des signaux avec des réponses impulsionnelles longues avec des implémentations overlap-and-add et overlap-and-save dans le domaine fréquentiel. Trouvez le bon compromis entre latence et vitesse de calcul avec le partitionnement automatique de la réponse impulsionnelle.
Codez et décodez différents formats ambisoniques. Interpolez des fonctions de transfert relatives à la tête (HRTF) échantillonnées spatialement.
Générez des plugins VST, des plugins AU et des plugins exécutables autonomes directement depuis le code MATLAB sans avoir à concevoir manuellement les interfaces utilisateur. Générez des projets JUCE C++ prêts à l'emploi pour un prototypage de plugins plus avancé (nécessite MATLAB Coder).
Utilisez des plugins AU et VST externes comme des objets MATLAB courants. Modifiez les paramètres des plugins et traitez des tableaux MATLAB de manière programmatique. Automatisez également l'association des paramètres des plugins avec les interfaces utilisateur et les commandes MIDI. Hébergez des plugins générés depuis votre code MATLAB pour une exécution plus efficace.
Avec les produits Coder de MathWorks, générez du code source en C et C++ à partir d'algorithmes de traitement du signal et de Machine Learning définis comme des fonctions, des objets ou des blocs de toolbox. Générez du code source CUDA depuis certaines fonctions d'extraction de caractéristiques comme mfcc
et mel-spectrogramme
.
Prototypez des designs de traitement audio sur Raspberry Pi™ avec des interfaces audio multicanal, intégrées ou externes. Créez des panneaux de contrôle interactifs sous forme d'applications mobiles pour les dispositifs iOS ou Android®.
Prototypez des designs de traitement audio avec des entrées et des sorties à échantillon unique pour le contrôle adaptatif du bruit, la validation d'appareils auditifs ou d'autres applications nécessitant une latence DSP aller-retour minimale. Ciblez automatiquement des systèmes audio Speedgoat et des cartes ST Discovery directement à partir de modèles Simulink.