Я хочу подсчитать процентное разделение POS в предложении, используя простор, аналогичный
Считайте глаголы, существительные и другие части речи с Python NLTK
В настоящее время умеет обнаруживать и подсчитывать POS. Как найти процентное соотношение.
from __future__ import unicode_literals
import spacy,en_core_web_sm
from collections import Counter
nlp = en_core_web_sm.load()
print Counter(([token.pos_ for token in nlp('The cat sat on the mat.')]))
Токовый выход:
Counter({u'NOUN': 2, u'DET': 2, u'VERB': 1, u'ADP': 1, u'PUNCT': 1})
Ожидаемый результат:
Noun: 28.5%
DET: 28.5%
VERB: 14.28%
ADP: 14.28%
PUNCT: 14.28%
Как записать вывод в фреймворк pandas?