Всем привет, в этой статье я расскажу, как установить MALLET через Google Colaboratory.
MALLET - это пакет на основе Java для статистической обработки естественного языка, классификации документов, кластеризации, тематического моделирования, извлечения информации и других приложений машинного обучения в текст. (Ресурс: http://mallet.cs.umass.edu/index.php)
MALLET помогает нам достичь лучших результатов в процессе обработки естественного языка. При попытке добавить МОЛОТОК к своим работам вы можете столкнуться с различными проблемами. Я подготовил эту статью, чтобы помочь вам с проблемами, которые могут возникнуть при установке MALLET. Надеюсь, это будет полезно…
Создание записной книжки Python в Google Colaboratory
Сначала вам нужно получить доступ к приложению Google Colaboratory из вашей учетной записи Google.
После этого откроется страница "Добро пожаловать в совместную лабораторию". Здесь вы можете получить информацию для начала работы. В разделе File на рисунке 1 мы щелкнем по записной книжке New Python 3 (1) и создадим новую рабочую среду.
После создания новой рабочей среды откроется наш файл IPython Notebook, как показано на рисунке 2. Когда вы создадите этот рабочий файл, папка с именем Colab Notebooks (рисунок 3) будет в вашей учетной записи Google Drive.
Щелкнув папку Colab Notebooks, мы сможем получить доступ к созданному вами файлу записной книжки Python (рисунок 4). Чтобы открыть этот файл, мы можем щелкнуть его правой кнопкой мыши и открыть в Google Laboratory.
Установка MALLET в Google Colaboratory
Для установки MALLET требуется Java JDK, как и при установке Windows, потому что MALLET - это пакет на основе Java.
Для установки Java JDK и MALLET в Google Colaboratory я воспользовался работой по адресу https://github.com/polsci/colab-gensim-mallet/blob/master/topic-modeling-with-colab-gensim-mallet. .ipynb .
После запуска блока кода на рисунке 5 мы видим, что установка Java JDK состоялась.
После выполнения блока кода, показанного на рисунке 6, будет произведена установка MALLET.
После установки Java JDK и MALLET давайте подключим Google Диск к нашему файлу записной книжки Python. Таким образом, мы можем получить доступ к нашим файлам (нашим наборам данных) на Google Диске и добавить их в нашу работу.
Важное примечание: у вас могут возникнуть проблемы, если вы подключите Google Диск и измените расположение рабочего файла перед установкой Java JDK и MALLET. Поэтому я рекомендую вам подключить Google Диск после установки Java JDK и MALLET.
После ввода вышеуказанного блока кода вы увидите ссылку для доступа к своей учетной записи на Google Диске. После перехода по этой ссылке откроется еще одно окно. После подтверждения разрешения на доступ скопируйте предоставленный вам код доступа и вставьте его в блок кода, показанный на рисунке 7, и нажмите Enter.
Когда мы исследуем раздел MALLET после загрузки наших наборов данных и выполнения операций, мы можем запустить блок кода, показанный на рисунке 8, и добавить MALLET к нашей работе.
Надеюсь, это было полезно, желаю хорошей работы. Оставайтесь с наукой и здоровьем…