Вопросы по теме 'stemming'

Анализатор иврита Lucene
Кто-нибудь знает, существует ли он? Я гуглил это уже несколько месяцев ... Спасибо
3641 просмотров
schedule 28.03.2024

Импорт WordNet в NLTK
Я хочу импортировать словарь wordnet , но когда я импортирую словарную форму wordnet , я вижу эту ошибку: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program...
33825 просмотров
schedule 05.12.2023

Stanford CoreNLP Morphology.stemStatic отключить преобразование в нижний регистр?
В комментариях к методу StemStatic класса Morphology указано, что он будет: вернуть новый WordTag, который имеет лемму в качестве значения word(). По умолчанию не имена собственные в нижнем регистре, если не были установлены параметры. (...
262 просмотров
schedule 01.01.2024

Обработка английских глаголов, оканчивающихся на «e»
Я реализую несколько заменителей строк с учетом этих преобразований. 'thou sittest' → 'you sit' 'thou walkest' → 'you walk' 'thou liest' → 'you lie' 'thou risest' → 'you rise' Если я оставлю это наивным, можно использовать регулярное...
75 просмотров

Параметр стемминга в Solr
Есть ли какой-либо параметр, например (edismax, dismax или любой другой), который я могу установить для работы в Solr, или мне нужно внести изменения в schema.xml Solr для реализации поиска? Проблема в том, что если я изменю schema.xml по умолчанию,...
54 просмотров
schedule 13.12.2023

Разъяснение Портера и Ланкастера
Я делаю stemming , используя Porter и Lancaster , и нахожу следующие наблюдения: Input: replied Porter: repli Lancaster: reply Input: twice porter: twice lancaster: twic Input: came porter: came lancaster: cam Input: In porter: In...
432 просмотров
schedule 08.01.2024