Имам списък с често срещани термини, получени от различни заявки за търсене на определен потребител.
Например:
спорт, бадминтон, футбол
футбол, спорт
изследване, AI, алгоритъм
изследване, адаптивно, персонализирано търсене
изследване, AI, невромрежа
Целта тук е да се изгради йерархичен потребителски профил въз основа на тези често срещани термини с хипотезата, че термините, които често се появяват в такива заявки, представляват теми, които интересуват потребителя. В йерархията общите термини с по-висока честота се поставят на по-високи нива, докато специфичните термини с по-ниска честота се поставят на по-ниските нива на йерархичния потребителски профил.
Очакваният резултат ще бъде дърво на потребителския профил, изглеждащо по този начин:
- User profile
- research
- AI
- алгоритъм
- персонализирано търсене
- ..
- sports
- soccer
- бадминтон
- research
И така, в момента съм блокиран и дори не знам как да започна или какви библиотеки да използвам. (Работя с java по този проект).
Ще съм много благодарен, ако някой може да ми помогне.
Благодаря предварително.