Как использовать испанский Wordnet в NLTK?

Я только что скачал испанский Wordnet из проекта GRIAL, формат XML. Как я могу использовать его в Python NLTK?

Кроме того, на этой же странице вы можете скачать тегированный корпус на испанском языке. Как я могу включить его?

python nltk wordnet

nanounanue 02.09.2014 источник

comment

почему бы просто не использовать встроенную испанскую функциональность NLTK? - James Tobin 10.09.2014

comment

@JamesTobin проблема со встроенным в том, что он очень глубокий и не очень точный. У вас есть идеи, как интегрировать? - nanounanue 11.09.2014

comment

ну, мой испанский ограничен, поэтому мне было сложно ориентироваться на указанном вами веб-сайте. но, учитывая, что у вас есть xml, я уверен, что вы могли бы что-то сделать с читателем корпуса NLTK. они могут читать XML-файл, используя nltk.googlecode.com/svn/trunk/doc/api/ возможно - James Tobin 15.09.2014

comment

Linkrot задался этим вопросом - Luke 04.01.2020

Ответы (1)

arrow_upward
2
arrow_downward

Используйте XMLCorpusReader для загрузки XML-данных в виде корпуса

Вот код для этого

from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, file)

Полностью рабочий пример, использующий XMLCorpusReader, приведен здесь

Rishi Dua 16.09.2014

Как использовать испанский Wordnet в NLTK?

Ответы (1)

Похожие вопросы