Току-що изтеглих испански Wordnet от проекта GRIAL, форматът е XML. Как мога да го използвам в Python NLTK?
Освен това на същата страница можете да изтеглите етикетиран корпус на испански. Как мога да го включа и аз?
Току-що изтеглих испански Wordnet от проекта GRIAL, форматът е XML. Как мога да го използвам в Python NLTK?
Освен това на същата страница можете да изтеглите етикетиран корпус на испански. Как мога да го включа и аз?
Използвайте XMLCorpusReader, за да заредите XML данни като корпус
Ето кода за това
from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, file)
Напълно работещ пример, който използва XMLCorpusReader, е даден тук