Всем привет, в этой статье я расскажу, как установить MALLET через Google Colaboratory.

MALLET - это пакет на основе Java для статистической обработки естественного языка, классификации документов, кластеризации, тематического моделирования, извлечения информации и других приложений машинного обучения в текст. (Ресурс: http://mallet.cs.umass.edu/index.php)

MALLET помогает нам достичь лучших результатов в процессе обработки естественного языка. При попытке добавить МОЛОТОК к своим работам вы можете столкнуться с различными проблемами. Я подготовил эту статью, чтобы помочь вам с проблемами, которые могут возникнуть при установке MALLET. Надеюсь, это будет полезно…

Создание записной книжки Python в Google Colaboratory

Сначала вам нужно получить доступ к приложению Google Colaboratory из вашей учетной записи Google.

После этого откроется страница "Добро пожаловать в совместную лабораторию". Здесь вы можете получить информацию для начала работы. В разделе File на рисунке 1 мы щелкнем по записной книжке New Python 3 (1) и создадим новую рабочую среду.

После создания новой рабочей среды откроется наш файл IPython Notebook, как показано на рисунке 2. Когда вы создадите этот рабочий файл, папка с именем Colab Notebooks (рисунок 3) будет в вашей учетной записи Google Drive.

Щелкнув папку Colab Notebooks, мы сможем получить доступ к созданному вами файлу записной книжки Python (рисунок 4). Чтобы открыть этот файл, мы можем щелкнуть его правой кнопкой мыши и открыть в Google Laboratory.

Установка MALLET в Google Colaboratory

Для установки MALLET требуется Java JDK, как и при установке Windows, потому что MALLET - это пакет на основе Java.

Для установки Java JDK и MALLET в Google Colaboratory я воспользовался работой по адресу https://github.com/polsci/colab-gensim-mallet/blob/master/topic-modeling-with-colab-gensim-mallet. .ipynb .

После запуска блока кода на рисунке 5 мы видим, что установка Java JDK состоялась.

После выполнения блока кода, показанного на рисунке 6, будет произведена установка MALLET.

После установки Java JDK и MALLET давайте подключим Google Диск к нашему файлу записной книжки Python. Таким образом, мы можем получить доступ к нашим файлам (нашим наборам данных) на Google Диске и добавить их в нашу работу.

Важное примечание: у вас могут возникнуть проблемы, если вы подключите Google Диск и измените расположение рабочего файла перед установкой Java JDK и MALLET. Поэтому я рекомендую вам подключить Google Диск после установки Java JDK и MALLET.

После ввода вышеуказанного блока кода вы увидите ссылку для доступа к своей учетной записи на Google Диске. После перехода по этой ссылке откроется еще одно окно. После подтверждения разрешения на доступ скопируйте предоставленный вам код доступа и вставьте его в блок кода, показанный на рисунке 7, и нажмите Enter.

Когда мы исследуем раздел MALLET после загрузки наших наборов данных и выполнения операций, мы можем запустить блок кода, показанный на рисунке 8, и добавить MALLET к нашей работе.

Надеюсь, это было полезно, желаю хорошей работы. Оставайтесь с наукой и здоровьем…