Здравейте всички, в тази статия ще ви кажа как да инсталирате MALLET чрез Google Colaboratory.

MALLET е базиран на Java пакет за статистическа обработка на естествен език, класификация на документи, групиране, моделиране на теми, извличане на информация и други приложения за машинно обучение към текст. (Ресурс: http://mallet.cs.umass.edu/index.php)

MALLET ни помага да постигнем по-добри резултати в процеса на обработка на естествен език. Докато се опитвате да добавите MALLET към творбите си, може да срещнете различни проблеми. Подготвих тази статия, за да ви помогна с проблемите, които може да срещнете по време на инсталирането на MALLET. Надявам се да е полезно…

Създаване на бележник на Python в Google Colaboratory

Първо трябва да получите достъп до приложението Google Colaboratory от вашия акаунт в Google.

След това ще се появи страницата Добре дошли в Colaboratory. Тук можете да получите информация, за да започнете. От секцията Файл на Фигура 1 ще щракнем върху бележника New Python 3 (1) и ще създадем нова работна среда.

След като създадете нова работна среда, нашият IPython Notebook файл ще се отвори, както е показано на Фигура 2. Когато създадете този работен файл, папката с име Colab Notebooks (Фигура 3) ще бъде във вашия акаунт в Google Drive.

След като щракнем върху папката с име Colab Notebooks, можем да получим достъп до създадения от вас бележник на python (Фигура 4). За да отворим този файл, можем да щракнете с десния бутон върху него и да го отворим с Google Laboratory.

Инсталиране на MALLET в Google Colaboratory

За инсталиране на MALLET е необходим Java JDK, както при инсталацията на Windows, тъй като MALLET е базиран на Java пакет.

За инсталирането на Java JDK и MALLET в Google Colaboratory се възползвах от работата на https://github.com/polsci/colab-gensim-mallet/blob/master/topic-modeling-with-colab-gensim-mallet .ipynb.

След като стартираме блока код на Фигура 5, можем да видим, че инсталирането на Java JDK е извършено.

След изпълнение на блока код на Фигура 6 ще се извърши инсталирането на MALLET.

След като инсталирате Java JDK и MALLET, нека свържем Google Drive с нашия файл на Python Notebook. По този начин можем да получим достъп до нашите файлове (нашите набори от данни) в Google Drive и да ги добавим към нашата работа.

Важна забележка: Може да срещнете проблеми, ако свържете Google Drive и промените местоположението на работния файл, преди да инсталирате Java JDK и MALLET. Затова ви препоръчвам да свържете Google Drive след инсталиране на Java JDK и MALLET.

След като въведете горния блок от код, ще видите връзката за достъп до вашия акаунт в Google Drive. След като щракнете върху тази връзка, ще се отвори друг прозорец. След като потвърдите разрешението за достъп, копирайте кода за достъп, който ще ви бъде даден, и го поставете в кодовия блок, изпълнен на фигура 7, и натиснете Enter.

Когато разгледаме секцията MALLET след зареждане на нашите набори от данни и извършване на операциите, можем да изпълним блока от код на Фигура 8 и да добавим MALLET към нашата работа.

Надявам се да е било полезно, желая ви добра работа. Останете с науката и здравето...