Main Content

Cette page a été traduite par traduction automatique. Cliquez ici pour voir la dernière version en anglais.

Visualisez la fréquence des mots dans un nuage de mots

Cet exemple montre comment visualiser la distribution de texte à l'aide de Text Analytics Toolbox™ dans un nuage de mots-clés. Utilisez ThingSpeak™ pour trier le texte et voir quels paramètres influencent la distribution ou le sentiment.

CheerLights permet aux utilisateurs du monde entier de se synchroniser sur une couleur définie par Twitter. ThingSpeak Channel 1417 stocke l'historique des couleurs CheerLights. Lisez des mots du canal ThingSpeak et comparez la distribution des horodatages précoces et tardifs.

Lire des données textuelles et calculer la fréquence des mots

Lisez les 500 derniers points de données du canal CheerLights ThingSpeak . Trouvez la fréquence des mots dans chaque document d'une collection à l'aide de la fonction bagofwords de la Text Analytics Toolbox.

colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]);
bagOfWords(colorData.LastCheerLightsCommand')
ans = 

  bagOfWords with properties:

          Counts: [61 68 40 59 23 42 52 59 40 46 10]
      Vocabulary: [1×11 string]
        NumWords: 11
    NumDocuments: 1

Trier les résultats par heure

Recherchez l'index de chaque point de données avec un horodatage antérieur à l'heure du déjeuner, puis recherchez tous les index des points de données après le déjeuner. Utilisez les index pour créer un tableau de tous les mots pour chaque cas.

lateTimeIndex = (hour(colorData.Timestamps) > 12);
earlyTimeIndex = (hour(colorData.Timestamps) < 12);

lateColors = colorData.LastCheerLightsCommand(lateTimeIndex);
earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);

Comparer la fréquence des mots dans Word Cloud

Utilisez les données triées pour générer les nuages ​​de mots. La fonction subplot permet de les comparer côte à côte.

subplot(1,2,1);
earlyWordCloud = wordcloud(earlyColors,'Color','blue')
title('Early Morning CheerLights');

subplot(1,2,2);
lateWordCloud = wordcloud(lateColors,'color','green')
title('Late Night CheerLights');
earlyWordCloud = 

  WordCloudChart with properties:

           WordData: [1×11 string]
           SizeData: [67 60 58 58 49 46 42 40 40 22 10]
    MaxDisplayWords: 100

  Use GET to show all properties


lateWordCloud = 

  WordCloudChart with properties:

           WordData: ["cyan"    "magenta"    "red"    "white"]
           SizeData: [1 1 1 1]
    MaxDisplayWords: 100

  Use GET to show all properties

La distribution des couleurs envoyées à CheerLights semble ne dépendre que vaguement de l'heure de la journée de la publication. Certaines couleurs ne sont fortes que l'après-midi, et d'autres sont constamment fortes toute la journée.

Voir aussi

(Text Analytics Toolbox) | (Text Analytics Toolbox)

Sites web externes