Свързани публикации 'word-cloud'
Как да извършите визуализация на данни за NLP проект с помощта на WordClouds
В тази поредица от 6 части ще обясня моя процес на използване на обработка на естествен език и машинно обучение за класифициране на жанровете на сценариите.
За повече информация вижте моето репо .
Част 1: Бизнес цел
Част 2: Събиране на данни
Част 3: „Разбор на данни“
Част 4: Проучвателен анализ на данни (вие сте тук)
Част 5: Изграждане на модел (все още не е публикувано)
Част 6: Внедряване на модел (все още не е публикувано)..
Wine Review PT6— EDA — ML
Въведение
Приложихме NLP към сомелиерското описание за всяко вино в част 5 .
Сега можем да разберем честотата на думите за вино, за грозде и във всички описания. Тук ще визуализираме честотата на думите.
Набор от данни
Kaggle
Ще използваме winemag-data-130k-v2.csv набор от данни за машинно обучение.
Програмен код
Код в google colab
Задача
Честота на думите за вино Честота на думите за грозде Честота на думите
wordcloud
Модулът wordcloud ни позволява..
Свързани въпроси 'word-cloud'
Данни за актуализиране на Wordcloud/работещ пример за добавяне на думи към облак?
Все още съм доста нов в d3.js и се гмуркам в пример за wordcloud, използвайки d3-cloud repo: https://github.com/jasondavies/d3-cloud
Примерът, който е там, работи за мен, превърнах го във функция, за да мога да я извикам, когато данните се...
2053 изгледи
schedule
09.01.2024
Увеличете разделителната способност с Word-Cloud и премахнете празната рамка
Използвам облак от думи с някои txt файлове. Как да променя този пример , ако искам 1) да увелича разделителна способност и 2) премахнете празната рамка.
#!/usr/bin/env python2
"""
Minimal Example
===============
Generating a square wordcloud...
32939 изгледи
schedule
18.02.2024
извличане на текст с tm пакет в R, премахване на думи, започващи от [http] или всяка друга конкретна дума
Аз съм нов в R и копаене на текст. Бях направил облак от думи от емисия в Twitter, свързана с някакъв термин. Проблемът, с който се сблъсквам, е, че в wordcloud се показва http:... или htt... Как да се справя с този проблем Опитах да използвам...
6381 изгледи
schedule
01.06.2024