Text Analytics Toolbox

Analyser et modéliser des données texte

Vous avez des questions ? Contactez l'équipe commerciale.

Text Analytics Toolbox propose des algorithmes et des visualisations pour le prétraitement, l'analyse et la modélisation de données texte. Les modèles créés avec cette toolbox peuvent être utilisés dans des domaines tels que l'analyse de sentiments, la maintenance prédictive ou la modélisation thématique.

Text Analytics Toolbox comprend des outils permettant de traiter du texte brut provenant de sources comme les logs d’équipements, les flux d'informations, les enquêtes, les rapports d’opérateurs ou les réseaux sociaux. Il est possible d'extraire du texte à partir de formats de fichiers courants, de prétraiter du texte brut, d'extraire des mots individuels, de convertir du texte en représentations numériques et de construire des modèles statistiques.

En utilisant des techniques de Machine Learning telles que LSA, LDA et word embeddings, il est possible de trouver des clusters et de créer des caractéristiques à partir de jeux de données texte de grande dimension. Les caractéristiques créées avec Text Analytics Toolbox peuvent être combinées avec des caractéristiques provenant d'autres sources de données pour construire des modèles de Machine Learning qui exploitent des données texte, numériques ou autres.

Code MATLAB qui extrait des données texte à partir de documents Microsoft Word vers un datastore.

Importer et visualiser du texte

Importez des données texte dans MATLAB à partir de fichiers uniques ou de grandes collections de fichiers, notamment des fichiers PDF, HTML ou Microsoft^® Word. Explorez visuellement des jeux de données texte grâce à des nuages de mots-clés et à des diagrammes de dispersion de texte.

Extraire des données texte à partir de fichiers PDF, HTML, Microsoft Word, Microsoft Excel ou CSV

Documentation | Exemples

Capture d'écran de la tâche Preprocess Text Data du Live Editor avec les résultats affichés sous forme de nuage de mots-clés.

Nettoyer et prétraiter le texte

Appliquez des fonctions de filtrage de haut niveau pour retirer les contenus superflus, tels que des URL, des balises HTML ou des signes de ponctuation. Corrigez les fautes d'orthographe, filtrez les mots vides et normalisez les mots en fonction de leur racine.

Nettoyer et et prétraiter des données texte dans Live Editor

Documentation | Exemples

Code MATLAB pour la création d'un diagramme de dispersion et d’un diagramme t-SNE du word embedding créé.

Convertir un texte en format structuré

Extrayez les caractéristiques linguistiques en utilisant un algorithme de tokenisation, calculez les statistiques de fréquence des mots pour représenter numériquement les données texte et entraînez les modèles de word embedding tels que word2vec et skip-gram.

Explorer et visualiser les word embeddings

Documentation | Exemples

Workflow d'apprentissage par transfert avec le modèle FinBERT de type Transformer sur des données texte pour identifier les attitudes positives et négatives.

Appliquer l'IA à l'analyse de texte

Adaptez un modèle de Machine Learning ou de Deep Learning, comme LSA, LDA ou LSTM, à des données texte. Exploitez les modèles de type Transformer, comme BERT, FinBERT ou GPT-2, pour effectuer l'apprentissage par transfert avec des données texte.

Entraîner le classificateur de documents BERT

Documentation | Exemples

Grands modèles de langage

Connectez MATLAB à l'API OpenAI™ Chat Completions. Exploitez les capacités de traitement du langage naturel des modèles GPT dans votre environnement MATLAB, pour des tâches telles que le résumé de texte ou le chat.

Grands modèles de langage (LLM) avec MATLAB

Documentation | Exemples

Illustration d'un nettoyage de données texte pour le traitement du langage naturel. À gauche : nuage de mots-clés des données brutes. À droite : nuage de mots-clés des données nettoyées.

Analyse de texte pour les ingénieurs

Développez des programmes de maintenance prédictive basés sur des données issues de capteurs et de logs texte. Automatisez la formalisation des exigences et la vérification de la conformité.

Recherche d'informations à partir de données provenant d’ordres de travail

Documentation | Exemples

Utiliser l'analyse de texte pour résumer plusieurs documents en un seul document.

Analyse de documents

Analysez un texte avec la modélisation thématique pour découvrir et visualiser les modèles sous-jacents, les tendances et les relations complexes. Résumez des documents, extrayez des mots-clés et évaluez l'importance et la similarité des documents.

Classifier des données texte avec un réseau de neurones à convolution

Documentation | Exemples

Nuages de mots-clés séparés en mots positifs et négatifs.

Analyse de sentiments

Identifiez les attitudes et les opinions exprimées dans les données texte pour catégoriser les déclarations comme étant positives, neutres ou négatives. Élaborez des modèles capables de prédire les sentiments en temps réel.

Analyse de sentiments dans MATLAB

Documentation | Exemples

Nuage de mots-clés généré à partir du roman Orgueil et Préjugés.

Génération de texte et classification

Utilisez le Deep Learning pour générer un nouveau texte à partir du texte observé et pour classer des descriptions de texte avec des word embeddings capables d'identifier des catégories.

Générer du texte en utilisant des autoencoders

Documentation | Exemples