Публикации по теме 'word-cloud'
Как выполнить визуализацию данных для проекта НЛП с помощью WordClouds
В этой серии из 6 частей я объясню свой процесс использования обработки естественного языка и машинного обучения для классификации жанров сценариев.
Дополнительную информацию см. в разделе мой репозиторий .
Часть 1. Бизнес-цель
Часть 2. Сбор данных
Часть 3. Обработка данных
Часть 4. Исследовательский анализ данных (вы здесь)
Часть 5. Построение модели (еще не опубликовано)
Часть 6. Развертывание модели (еще не опубликовано)..
Wine Review PT6 — EDA — ML
Введение
Мы применили НЛП к описанию сомелье каждого вина в 5 части .
Теперь мы можем узнать частотность слов для вина, для винограда и во всех описаниях. Здесь мы собираемся визуализировать частоту слов.
Набор данных
Kaggle
Мы будем использовать набор данных winemag-data-130k-v2.csv для машинного обучения.
Исходный код
Код в Google Colab
Задача
Частота слов для вина Частота слов для винограда Частота слов
облако слов
Модуль wordcloud позволяет..
Вопросы по теме 'word-cloud'
Данные обновления Wordcloud/рабочий пример добавления слов в облако?
Я все еще довольно новичок в d3.js, и я погружаюсь в пример wordcloud, используя репозиторий d3-cloud: https://github.com/jasondavies/d3-cloud
Пример, который там работает для меня, я превратил его в функцию, поэтому я могу вызывать ее при...
2053 просмотров
schedule
09.01.2024
Увеличьте разрешение с помощью облака слов и удалите пустую рамку
Я использую облако слов с некоторыми текстовыми файлами. Как изменить этот пример , если я хочу 1) увеличить разрешение и 2) удалить пустую границу.
#!/usr/bin/env python2
"""
Minimal Example
===============
Generating a square wordcloud from...
32939 просмотров
schedule
18.02.2024
анализ текста с помощью пакета tm в R, удаление слов, начинающихся с [http] или любого другого специфического слова
Я новичок в R и интеллектуальном анализе текста. Я сделал облако слов из ленты Twitter, относящееся к какому-то термину. Проблема, с которой я столкнулся, заключается в том, что в wordcloud отображается http: ... или htt ... Как мне решить эту...
6381 просмотров
schedule
01.06.2024
Как установить интервал между словами в wordcloud?
Когда я бегу
library(RColorBrewer)
library(wordcloud)
set.seed(2)
wordcloud(
words = c("One", "Two", "Three"),
freq = c(100, 50, 20)
)
Я получаю сюжет, похожий на
Как настроить интервал между словами?
Я старался:...
1337 просмотров
schedule
03.06.2024
Как я могу объединить dicts (значения в значения одного и того же ключа и нового ключа)?
У меня проблема с объединением словарей. У меня так много кода, поэтому я показываю на примере, в чем моя проблема.
d1 = {'the':3, 'fine':4, 'word':2}
+
d2 = {'the':2, 'fine':4, 'word':1, 'knight':1, 'orange':1}
+
d3 = {'the':5, 'fine':8,...
1045 просмотров
schedule
12.11.2022
Проблемы с неанглийскими буквами при использовании wordcloud по тексту, добытому в твиттере
Я новичок в Stackoverflow и стараюсь следовать рекомендациям. Однако, если есть что-то, что я пропустил, пожалуйста, дайте мне знать.
В последнее время я играю с анализом текста в R; что-то я новичок в этом. Для этого я использовал пакеты,...
1323 просмотров
schedule
25.11.2023
Почему мои биграммы все еще рассматривают стоп-слова?
Результат по-прежнему учитывает стоп-слова... Несколько строк моего txt:
Sensacional, ума дас melhores римейки де анимасао Саи сделать кино emocionado, absurdamente lindo, insensibilidade де quem reclama сделать мюзикл, lindo demais. (...)о фильм...
947 просмотров
schedule
28.03.2024
слова wordcloud не подходят для маски
Я пытаюсь создать облако слов из фрейма данных, где есть столбец слов и столбец для их соответствующих частот. Я также загрузил изображение, которое хочу использовать в качестве маски, например: cloud изображение
Я не могу заставить wordcloud...
2815 просмотров
schedule
17.10.2022
Как преобразовать матрицу терминов документа в R?
Здравствуйте, у меня есть матрица терминов документа, и я преобразовал ее с помощью функции tidy() , и она отлично работает. Я хочу построить облако слов на основе частоты слова. Итак, моя преобразованная таблица выглядит так:
>...
564 просмотров
schedule
28.10.2023
Не удается импортировать имя «WordCloud»
Я использую Jupyter Notebook и пытаюсь создать облако слов. Оказывается, есть некоторые проблемы с пакетом подушек, и в Интернете полно разговоров об этом. Сначала я получал ошибку DLL. Я пробовал много разных вещей и не уверен, какой из них...
4333 просмотров
schedule
23.12.2023