Вопросы по теме 'stop-words'
дисмакс подвиг. стоп-слова, синонимы и т. д.
Поддерживает ли dismax все функции, такие как стандартный requestHandler? стоп-слова? синонимы? вытекающий ? вы слышали о "edismax"?
Я использую Solr1.4
Для моих первых тестов стоп-слов это не работает .. ну, я так думаю ..
Я настроил...
629 просмотров
schedule
31.10.2022
Стоп-слова в строку
Я хочу создать функцию в PHP, которая будет возвращать true, когда обнаружит, что в строке есть нехорошие слова.
Вот пример:
function stopWords($string, $stopwords) {
if(the words in the stopwords variable are found in the string) {
return...
1180 просмотров
schedule
21.02.2024
разбор стоп-слов википедии html с помощью nltk
В связи с этим вопросом я работаю над программой для извлечения введения сущностей википедии. Как вы можете прочитать в приведенной выше ссылке, мне уже удалось запросить API, и теперь я сосредоточился на обработке XML, возвращенного вызовом API....
693 просмотров
schedule
09.02.2024
Как добавить языковую поддержку для полнотекстового поиска?
Я хочу реализовать поддержку полнотекстового поиска для некоторого языка (украинский) в MongoDB. Какие ресурсы я должен предоставить (или сделать)? Нужно ли мне внести некоторые изменения в исходники Mongo?
610 просмотров
schedule
14.04.2024
Удаление стоп-слов с помощью NLTK и Pandas
У меня есть некоторые проблемы с Pandas и NLTK. Я новичок в программировании, так что извините, если я задаю вопросы, которые может быть легко решить. У меня есть файл csv, который имеет 3 столбца (Id, Title, Body) и около 15 000 строк.
Моя цель...
11459 просмотров
schedule
02.04.2024
Удаление стоп-слова с помощью NLTK
Я работал с NLTK и классификацией баз данных. У меня проблема с удалением стоп-слова. Когда я распечатываю список стоп-слов, все слова отображаются с буквой «u» перед ними. Например: [u'all ', u'just', u'being ', u'over', u'both ', u'through'] Я не...
1153 просмотров
schedule
25.10.2023
Удаление существительных, содержащих стоп-слова, с помощью spaCy
Я использовал spaCy для поиска наиболее употребляемых существительных и noun_phrases.
Я могу успешно избавиться от знаков препинания и стоп-слов при поиске отдельных существительных
docx = nlp('The bird is flying high in the sky blue of...
2544 просмотров
schedule
06.12.2023
Ручная вставка стоп-слов по теме
Я использую встроенную команду anti_join(get_stopwords()) tidytext для очистки документов от данных отзывов клиентов о технических продуктах, но я обнаружил, что выходной корпус состоит в основном из технических спецификаций (например, Windows 10,...
27 просмотров
schedule
17.03.2024
удаление стоп-слов NLTK
Я пытаюсь удалить стоп-слова из моего набора данных.
stopwordsw = nltk.corpus.stopwords.words('german')
def remove_stopwords(txt_clean):
txt_clean = [Word for Word in txt_clean if Word not in stopwords]
return txt_clean...
19 просмотров
schedule
29.10.2022