Text Analytics Toolbox

 

Text Analytics Toolbox

Analyser et modéliser des données texte

Code MATLAB qui extrait des données texte à partir de documents Microsoft Word vers un datastore.

Importer et visualiser du texte

Importez des données texte dans MATLAB à partir de fichiers uniques ou de grandes collections de fichiers, notamment des fichiers PDF, HTML ou Microsoft® Word. Explorez visuellement des jeux de données texte grâce à des nuages de mots-clés et à des diagrammes de dispersion de texte.

Capture d'écran de la tâche Preprocess Text Data du Live Editor avec les résultats affichés sous forme de nuage de mots-clés.

Nettoyer et prétraiter le texte

Appliquez des fonctions de filtrage de haut niveau pour retirer les contenus superflus, tels que des URL, des balises HTML ou des signes de ponctuation. Corrigez les fautes d'orthographe, filtrez les mots vides et normalisez les mots en fonction de leur racine.

Code MATLAB pour la création d'un diagramme de dispersion et d’un diagramme t-SNE du word embedding créé.

Convertir un texte en format structuré

Extrayez les caractéristiques linguistiques en utilisant un algorithme de tokenisation, calculez les statistiques de fréquence des mots pour représenter numériquement les données texte et entraînez les modèles de word embedding tels que word2vec et skip-gram.

Workflow d'apprentissage par transfert avec le modèle FinBERT de type Transformer sur des données texte pour identifier les attitudes positives et négatives.

Appliquer l'IA à l'analyse de texte

Adaptez un modèle de Machine Learning ou de Deep Learning, comme LSA, LDA ou LSTM, à des données texte. Exploitez les modèles de type Transformer, comme BERT, FinBERT ou GPT-2, pour effectuer l'apprentissage par transfert avec des données texte.

Grands modèles de langage

Connectez MATLAB à l'API OpenAI™ Chat Completions. Exploitez les capacités de traitement du langage naturel des modèles GPT dans votre environnement MATLAB, pour des tâches telles que le résumé de texte ou le chat.

Illustration d'un nettoyage de données texte pour le traitement du langage naturel. À gauche : nuage de mots-clés des données brutes. À droite : nuage de mots-clés des données nettoyées.

Analyse de texte pour les ingénieurs

Développez des programmes de maintenance prédictive basés sur des données issues de capteurs et de logs texte. Automatisez la formalisation des exigences et la vérification de la conformité.

Utiliser l'analyse de texte pour résumer plusieurs documents en un seul document.

Analyse de documents

Analysez un texte avec la modélisation thématique pour découvrir et visualiser les modèles sous-jacents, les tendances et les relations complexes. Résumez des documents, extrayez des mots-clés et évaluez l'importance et la similarité des documents.

Nuages de mots-clés séparés en mots positifs et négatifs.

Analyse de sentiments

Identifiez les attitudes et les opinions exprimées dans les données texte pour catégoriser les déclarations comme étant positives, neutres ou négatives. Élaborez des modèles capables de prédire les sentiments en temps réel.

Nuage de mots-clés généré à partir du roman Orgueil et Préjugés.

Génération de texte et classification

Utilisez le Deep Learning pour générer un nouveau texte à partir du texte observé et pour classer des descriptions de texte avec des word embeddings capables d'identifier des catégories.

Demander une version d’essai gratuite

Profitez de 30 jours pour tester.


Prêt à acheter ?

Découvrez les tarifs et les produits.

Vous êtes étudiant ?

Votre établissement propose peut-être déjà un accès à MATLAB, Simulink et d'autres produits complémentaires via la licence Campus-Wide.