Visualisez la fréquence des mots dans un nuage de mots
Cet exemple montre comment visualiser la distribution de texte à l'aide de Text Analytics Toolbox™ dans un nuage de mots-clés. Utilisez ThingSpeak™ pour trier le texte et voir quels paramètres influencent la distribution ou le sentiment.
CheerLights permet aux utilisateurs du monde entier de se synchroniser sur une couleur définie par Twitter. ThingSpeak Channel 1417 stocke l'historique des couleurs CheerLights. Lisez des mots du canal ThingSpeak et comparez la distribution des horodatages précoces et tardifs.
Lire des données textuelles et calculer la fréquence des mots
Lisez les 500 derniers points de données du canal CheerLights ThingSpeak . Trouvez la fréquence des mots dans chaque document d'une collection à l'aide de la fonction bagofwords
de la Text Analytics Toolbox.
colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]); bagOfWords(colorData.LastCheerLightsCommand')
ans = bagOfWords with properties: Counts: [61 68 40 59 23 42 52 59 40 46 10] Vocabulary: [1×11 string] NumWords: 11 NumDocuments: 1
Trier les résultats par heure
Recherchez l'index de chaque point de données avec un horodatage antérieur à l'heure du déjeuner, puis recherchez tous les index des points de données après le déjeuner. Utilisez les index pour créer un tableau de tous les mots pour chaque cas.
lateTimeIndex = (hour(colorData.Timestamps) > 12); earlyTimeIndex = (hour(colorData.Timestamps) < 12); lateColors = colorData.LastCheerLightsCommand(lateTimeIndex); earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);
Comparer la fréquence des mots dans Word Cloud
Utilisez les données triées pour générer les nuages de mots. La fonction subplot
permet de les comparer côte à côte.
subplot(1,2,1); earlyWordCloud = wordcloud(earlyColors,'Color','blue') title('Early Morning CheerLights'); subplot(1,2,2); lateWordCloud = wordcloud(lateColors,'color','green') title('Late Night CheerLights');
earlyWordCloud = WordCloudChart with properties: WordData: [1×11 string] SizeData: [67 60 58 58 49 46 42 40 40 22 10] MaxDisplayWords: 100 Use GET to show all properties lateWordCloud = WordCloudChart with properties: WordData: ["cyan" "magenta" "red" "white"] SizeData: [1 1 1 1] MaxDisplayWords: 100 Use GET to show all properties
La distribution des couleurs envoyées à CheerLights semble ne dépendre que vaguement de l'heure de la journée de la publication. Certaines couleurs ne sont fortes que l'après-midi, et d'autres sont constamment fortes toute la journée.
Voir aussi
Get Started with Text Analytics Toolbox (Text Analytics Toolbox) | wordcloud
(Text Analytics Toolbox)