Вопросы по теме 'stop-words'

дисмакс подвиг. стоп-слова, синонимы и т. д.
Поддерживает ли dismax все функции, такие как стандартный requestHandler? стоп-слова? синонимы? вытекающий ? вы слышали о "edismax"? Я использую Solr1.4 Для моих первых тестов стоп-слов это не работает .. ну, я так думаю .. Я настроил...
629 просмотров
schedule 31.10.2022

Стоп-слова в строку
Я хочу создать функцию в PHP, которая будет возвращать true, когда обнаружит, что в строке есть нехорошие слова. Вот пример: function stopWords($string, $stopwords) { if(the words in the stopwords variable are found in the string) { return...
1180 просмотров
schedule 21.02.2024

разбор стоп-слов википедии html с помощью nltk
В связи с этим вопросом я работаю над программой для извлечения введения сущностей википедии. Как вы можете прочитать в приведенной выше ссылке, мне уже удалось запросить API, и теперь я сосредоточился на обработке XML, возвращенного вызовом API....
693 просмотров

Как добавить языковую поддержку для полнотекстового поиска?
Я хочу реализовать поддержку полнотекстового поиска для некоторого языка (украинский) в MongoDB. Какие ресурсы я должен предоставить (или сделать)? Нужно ли мне внести некоторые изменения в исходники Mongo?
610 просмотров
schedule 14.04.2024

Удаление стоп-слов с помощью NLTK и Pandas
У меня есть некоторые проблемы с Pandas и NLTK. Я новичок в программировании, так что извините, если я задаю вопросы, которые может быть легко решить. У меня есть файл csv, который имеет 3 столбца (Id, Title, Body) и около 15 000 строк. Моя цель...
11459 просмотров
schedule 02.04.2024

Удаление стоп-слова с помощью NLTK
Я работал с NLTK и классификацией баз данных. У меня проблема с удалением стоп-слова. Когда я распечатываю список стоп-слов, все слова отображаются с буквой «u» перед ними. Например: [u'all ', u'just', u'being ', u'over', u'both ', u'through'] Я не...
1153 просмотров
schedule 25.10.2023

Удаление существительных, содержащих стоп-слова, с помощью spaCy
Я использовал spaCy для поиска наиболее употребляемых существительных и noun_phrases. Я могу успешно избавиться от знаков препинания и стоп-слов при поиске отдельных существительных docx = nlp('The bird is flying high in the sky blue of...
2544 просмотров

Ручная вставка стоп-слов по теме
Я использую встроенную команду anti_join(get_stopwords()) tidytext для очистки документов от данных отзывов клиентов о технических продуктах, но я обнаружил, что выходной корпус состоит в основном из технических спецификаций (например, Windows 10,...
27 просмотров
schedule 17.03.2024

удаление стоп-слов NLTK
Я пытаюсь удалить стоп-слова из моего набора данных. stopwordsw = nltk.corpus.stopwords.words('german') def remove_stopwords(txt_clean): txt_clean = [Word for Word in txt_clean if Word not in stopwords] return txt_clean...
19 просмотров
schedule 29.10.2022