Я новичок в Sagemaker и провожу несколько тестов, чтобы измерить производительность NTM и LDA на AWS по сравнению с молотком LDA и собственной моделью Gensim LDA.
Я хочу проверить обученных моделей на Sagemaker и посмотреть, какие слова имеют наибольший вклад в каждую тему. А также для оценки согласованности модели.
Я смог успешно получить, какие слова имеют наибольший вклад в каждую тему для NTM на Sagemaker, загрузив выходной файл, распаковав его и разархивировав, чтобы открыть 3 файла params, symbol.json и meta.json.
Однако, когда я пытаюсь проделать тот же процесс для LDA, нераспакованный выходной файл не может быть разархивирован.
Возможно, мне что-то не хватает или мне нужно сделать что-то другое для LDA по сравнению с NTM, но мне не удалось найти никакой документации по этому поводу. Кроме того, кто-нибудь нашел простой способ расчета согласованности модели?
Будем очень благодарны любой помощи!