Проблемы с установкой данных NLTK

Я пытаюсь установить данные NLTK на Mac OSX 10.9. Каталог загрузки, который необходимо установить, как указано в документации NLTK 3.0, — это /usr/share/nltk_data для централизованной установки. Но для этого пути я получаю сообщение об ошибке OSError: [Errno 13] Отказано в доступе: '/usr/share/nltk_data'

Могу ли я установить каталог загрузки как /Users/ananya/nltk_data для центральной установки?

У меня на машине установлен Python 2.7

Спасибо, Ананья.


person ac11    schedule 05.03.2014    source источник
comment
вы использовали sudo при установке?   -  person alvas    schedule 05.03.2014
comment
так что согласно документации,   -  person ac11    schedule 05.03.2014
comment
поэтому, согласно документации, я сделал это ››› import nltk ››› nltk.download(). Открылось новое окно, показывающее загрузчик NLTK и каталог загрузки по умолчанию /Users/ananya/nltk_data   -  person ac11    schedule 05.03.2014


Ответы (1)


Ты пытался:

$ sudo python
>>> import nltk
>>> nltk.download()

Чтобы проверить, работают ли загрузки, попробуйте несколько корпусов, которые вы загрузили, например.

>>> from nltk.corpus import wordnet
>>> wordnet.synsets('dog')
[Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'), Synset('frank.n.02'), Synset('pawl.n.01'), Synset('andiron.n.01'), Synset('chase.v.01')]

Если корпуса не установлены должным образом, вы увидите что-то вроде этого:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python2.7/dist-packages/nltk/corpus/util.py", line 68, in __getattr__
    self.__load()
  File "/usr/local/lib/python2.7/dist-packages/nltk/corpus/util.py", line 56, in __load
    except LookupError: raise e
LookupError: 
**********************************************************************
  Resource 'corpora/wordnet' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - '/home/alvas/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************
person alvas    schedule 05.03.2014
comment
спасибо, это сработало. Теперь мне нужно выяснить, правильно ли был установлен NLTK, поскольку я не использовал $sudo python. Есть идеи как? - person ac11; 05.03.2014