Text Analytics Toolbox
Analyser et modéliser des données texte
Vous avez des questions ? Contactez l'équipe commerciale.
Vous avez des questions ? Contactez l'équipe commerciale.
Text Analytics Toolbox propose des algorithmes et des visualisations pour le prétraitement, l'analyse et la modélisation de données texte. Les modèles créés avec cette toolbox peuvent être utilisés dans des domaines tels que l'analyse de sentiments, la maintenance prédictive ou la modélisation thématique.
Text Analytics Toolbox comprend des outils permettant de traiter du texte brut provenant de sources comme les logs d’équipements, les flux d'informations, les enquêtes, les rapports d’opérateurs ou les réseaux sociaux. Il est possible d'extraire du texte à partir de formats de fichiers courants, de prétraiter du texte brut, d'extraire des mots individuels, de convertir du texte en représentations numériques et de construire des modèles statistiques.
En utilisant des techniques de Machine Learning telles que LSA, LDA et word embeddings, il est possible de trouver des clusters et de créer des caractéristiques à partir de jeux de données texte de grande dimension. Les caractéristiques créées avec Text Analytics Toolbox peuvent être combinées avec des caractéristiques provenant d'autres sources de données pour construire des modèles de Machine Learning qui exploitent des données texte, numériques ou autres.
Importez des données texte dans MATLAB à partir de fichiers uniques ou de grandes collections de fichiers, notamment des fichiers PDF, HTML ou Microsoft® Word. Explorez visuellement des jeux de données texte grâce à des nuages de mots-clés et à des diagrammes de dispersion de texte.
Appliquez des fonctions de filtrage de haut niveau pour retirer les contenus superflus, tels que des URL, des balises HTML ou des signes de ponctuation. Corrigez les fautes d'orthographe, filtrez les mots vides et normalisez les mots en fonction de leur racine.
Extrayez les caractéristiques linguistiques en utilisant un algorithme de tokenisation, calculez les statistiques de fréquence des mots pour représenter numériquement les données texte et entraînez les modèles de word embedding tels que word2vec et skip-gram.
Adaptez un modèle de Machine Learning ou de Deep Learning, comme LSA, LDA ou LSTM, à des données texte. Exploitez les modèles de type Transformer, comme BERT, FinBERT ou GPT-2, pour effectuer l'apprentissage par transfert avec des données texte.
Connectez MATLAB à l'API OpenAI™ Chat Completions. Exploitez les capacités de traitement du langage naturel des modèles GPT dans votre environnement MATLAB, pour des tâches telles que le résumé de texte ou le chat.
Développez des programmes de maintenance prédictive basés sur des données issues de capteurs et de logs texte. Automatisez la formalisation des exigences et la vérification de la conformité.
Analysez un texte avec la modélisation thématique pour découvrir et visualiser les modèles sous-jacents, les tendances et les relations complexes. Résumez des documents, extrayez des mots-clés et évaluez l'importance et la similarité des documents.
Identifiez les attitudes et les opinions exprimées dans les données texte pour catégoriser les déclarations comme étant positives, neutres ou négatives. Élaborez des modèles capables de prédire les sentiments en temps réel.
Utilisez le Deep Learning pour générer un nouveau texte à partir du texte observé et pour classer des descriptions de texte avec des word embeddings capables d'identifier des catégories.
Profitez de 30 jours pour tester.
Découvrez les tarifs et les produits.
Votre établissement propose peut-être déjà un accès à MATLAB, Simulink et d'autres produits complémentaires via la licence Campus-Wide.