Итак, я должен признать, что я полный новичок в nlp, и я ничего не знаю о nltk, я просто пытаюсь использовать устаревший код, оставленный предыдущим разработчиком. Мне нужно лемматизировать слова, в основном из химических и биотехнологических публикаций. Обычно я использую WordNetLemmatizer. В большинстве случаев это работает.
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemmatizer.lemmatize('cats')
возвращает кота.
Но потом я пытаюсь
lemmatizer.lemmatize('dehydrogenases')
он возвращает «дегидрогеназы». Я хочу, чтобы он вернул «дегидрогеназу». Как я могу это сделать?