Я только что скачал испанский Wordnet из проекта GRIAL, формат XML. Как я могу использовать его в Python NLTK?
Кроме того, на этой же странице вы можете скачать тегированный корпус на испанском языке. Как я могу включить его?
Я только что скачал испанский Wordnet из проекта GRIAL, формат XML. Как я могу использовать его в Python NLTK?
Кроме того, на этой же странице вы можете скачать тегированный корпус на испанском языке. Как я могу включить его?
Используйте XMLCorpusReader для загрузки XML-данных в виде корпуса
Вот код для этого
from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, file)
Полностью рабочий пример, использующий XMLCorpusReader, приведен здесь