Как да добавите нови документи към съществуващ модел на тема в mallet или да групирате модела за голям брой документи

Искам да използвам моделиране на теми и открих, че MALLET е подходящ за мен.
Успешно създадох първата си демонстрация, използвайки около 0,1 милиона документа. Сега според изискванията ми трябва да се справя с 10 милиона документа, които не мога да обработя допълнително. Възможно ли е да добавите нови документи към съществуващ модел на тема или нещо като създаване на два модела и сливане в един модел и получаване на изхода чрез сливане на всички модели, защото mallet не може да обработва толкова големи документи наведнъж, за които мисля да пакетирам моделите и получете резултата чрез обединяване на всички документи
Кажете например, че ще направя 100 партиди от 0,1 милиона документа и ще пусна чук върху всяка партида и най-накрая ще получа резултат чрез обединяване на всичките 100 партиди

Благодаря


person Hardik Dobariya    schedule 29.10.2014    source източник


Отговори (1)


Не мисля, че това е възможно с Mallet. Не мисля, че след като създадете модела, можете постепенно да добавяте нови документи към обучения модел и да го обучите отново.

Ще чакам някой да подкрепи или опровергае отговора ми.

person London guy    schedule 15.01.2015