Упрощенные теги после расчёта тегов POS по NLTK.
simplified = [(word, simplify_wsj_tag(tag)) for word, tag in posTagged]
print(simplifiedTags)
#[('And', 'CONJ'), ('now', 'ADV'), ('for', 'ADP'), ('something', 'NOUN'), ('completely', 'ADV'), ('different', 'ADJ')]
Теперь нужно найти лемму для каждого слова. Каждый из них, кроме спряжения, может быть сопоставлен с классом POS в wordnet - существительным, прилагательным, наречием, глаголом. Что делать со словами, помеченными как Conjuction? Какой самый близкий родственник конъюнктуры среди всех четырех классов? Или они должны быть полностью исключены из приговора?
pos='r'
при вызовеWordNetLemmatizer.lemmatize
. - person lenz   schedule 20.08.2017