Я изменяю исходный код моркови для проекта. Акк. алгоритму LINGO он сначала генерирует наиболее вероятные метки и строит кластеры, которые лучше всего соответствуют меткам, верно? Итак, могу ли я ввести собственный набор меток для морковки, чтобы увидеть, как она группирует документы вокруг них?
Могу ли я использовать свои собственные этикетки для моркови2
Ответы (1)
К сожалению, вы не можете предоставить свои собственные метки для кластеризации с помощью Lingo.
С другой стороны, алгоритм присвоения метки документу в Lingo очень прост — если документ содержит слова метки, ему будет присвоена метка. Поэтому вы можете добиться того же эффекта, например, проиндексировав свои документы в Lucene, а затем запросив индекс, используя предопределенные метки, которые у вас есть.
person
Stanislaw Osinski
schedule
18.11.2014
Акк. к ответу Я полагаю, что самым важным и уникальным аспектом LINGO является создание лейбла ??
- person sir_osthara; 18.11.2014
Верный. Взгляните на публикации Carrot2 для некоторых документов, таких как Lingo: алгоритм кластеризации результатов поиска на основе единственного числа Декомпозиция или алгоритм, основанный на концепции, для кластеризации результатов поиска.
- person Stanislaw Osinski; 19.11.2014