Вопросы по теме 'word-count'

получение ошибки при выполнении Cassandra WordCount на Hadoop: java.lang.NoSuchMethodError: org.apache.thrift.meta_data.FieldValueMetaData. ‹init› (BZ) V
Пытаюсь выполнить пример WordCount из cassandra и получаю ошибку: Исключение в потоке «main» java.lang.NoSuchMethodError: org.apache.thrift.meta_data.FieldValueMetaData. (BZ) V в org.apache.cassandra.thrift.SlicePredicate....
1846 просмотров
schedule 22.01.2024

получить количество слов в столбце sql
после следующих запросов SELECT * FROM table; SELECT REGEXP_REPLACE(description || '!', '[^[:punct:]]') FROM table; SELECT REGEXP_REPLACE ( description, '[' || REGEXP_REPLACE ( description || '!', '[^[:punct:]]') || ']') test FROM...
1292 просмотров
schedule 29.10.2022

Подсчет фраз в Python с использованием NLTK
Я пытаюсь получить количество фраз из текстового файла, но пока могу получить только количество слов (см. ниже). Мне нужно расширить эту логику, чтобы подсчитать, сколько раз фраза из двух слов появляется в текстовом файле. Насколько я понимаю,...
2287 просмотров
schedule 14.01.2024

Как я могу переписать свои операторы if, чтобы они работали?
Итак, в основном программа должна делать следующее: мы вводим имя файла -i input.txt -o output.txt -c в командной строке (аргументы командной строки (argc и argv)) и программа должна прочитать входной файл, подсчитать, сколько там слов есть, и если...
103 просмотров
schedule 12.06.2024

как подсчитать количество слов для каждого столбца, который находится в структуре массива в Pandas
У меня есть строковый столбец в моем фрейме данных, где я разделил предложения на слова. Теперь мне нужно вычислить появление этого слова и преобразовать их в столбцы. В основном создание матрицы терминов документа 0...
69 просмотров
schedule 27.02.2024

Пример структурированного потокового подсчета слов Apache Spark в локальном режиме очень медленный
Я пытаюсь запустить пример подсчета слов Apache Spark для структурированной потоковой передачи в локальном режиме, и я получаю очень большую задержку в 10-30 секунд. Вот код, который я использую (взято с...
320 просмотров
schedule 03.10.2022

Питон | Подсчитайте слова в кадре данных, которые соответствуют предварительно заданному списку слов
Я пытаюсь подсчитать слова в столбце Dataframe, состоящем из речей. Я создал списки со словами, связанными с разными темами, например: Care = [safe, peace, compassion, empath, care, caring, protect, shield, shelter] Теперь я хотел бы...
42 просмотров
schedule 15.01.2024