Опитвам се да направя уебсайт за препоръки за книги. Обходих някои сайтове за книги и имам около 15 милиона отделни книги в базата данни, която е в neo4j.
Сега за някои жанрове, като мистерия и трилър, има поне около 1 милион книги. Трябва да съставя топ 20 списък с препоръки. Сегашният ми подход-
- вземете книгите
- изпълнете сравнение на подобие (век-косинус или Pearsons)
- сортиране и показване
са скъпи и отнемат време, никак не са добри за система в реално време. Мислех да поддържам сортиран списък по жанр, като свързвам neo4j с традиционна DB и вземам най-добрите от тази db чрез neo4j. Но това също е бавно (отнема няколко десетки секунди). Има ли по-прост и по-интуитивен начин да направите това? Всякакви идеи ще помогнат.