Това, от което се нуждая, всъщност е просто намек откъде мога да започна.
Донякъде съм запознат с Mahout, поне теоретично. Знам как работи, как да го настроя и т.н. и мога да създам проста система за препоръки, базирана на съвместно филтриране.
Сега обаче се опитвам да направя нещо по-сложно и дори след като прочетох доста за различни алгоритми, не съм сигурен в коя посока да тръгна.
Набързо това, което искам да направя е:
Крайната цел е да се дефинира един скалар ("резултат") за всеки един от набор от обекти въз основа на някои "известни" обекти. Субектите взаимодействат помежду си, известните резултати влияят и определят неизвестните. Можете да си представите със следния пример.
Имам много бели дрехи и няколко цветни дрехи; червени, сини, зелени... сложих ги в пералнята. Искам да знам какви цветове ще добият белите след прането.
Неща, които трябва да вземете предвид:
- правим поредица от пране с различни "актьори"... някои дрехи се перат на 1-во и 3-то пране, някои от тях само на 2-ро, някои от тях се перат на всички
- при последователни пранета дрехите, които преди са били бели, но сега цветни, също влияят върху останалите, но не толкова силно (тъй като не са толкова цветни)
- някои цветове не "оцветяват" толкова много, колкото други. например червеното има силен ефект върху повечето дрехи, но зеленото не толкова
- ефектът на оцветяване също зависи от това колко дрехи има при едно пране. Ако перете червена риза с бяла тениска, тя става много по-цветна, отколкото ако имаше 100 други бели тениски
- дрехите не "губят" цвета си, когато влияят на другите
Можете да видите, че докато изчисляват, обектите всъщност имат 2 присвоени скалара:
- оттенъкът на цвета (това също определя "силата на оцветяване", както е споменато по-горе). Нюансът може да бъде представен като число, да речем от 0 до 1. Кохерентността между силата на оцветяване и числото на цвета не е линейна. По-скоро краищата на скалата имат по-голяма сила на оцветяване (0 и 1), докато средата (0,5) има по-малко
- цветът "лекота" (колко е оцветен обект, за оригинално оцветените дрехи е 1, за белите е 0), което в същото време определя и силата на оцветяване, независимо от нюанса
И така, отново това, което знам:
- кои дрехи къде са изпрани при кое последователно пране
- Знам оригиналния цвят на някои от тях, останалите са бели в началото
Какво искам да знам: - цвета на всички дрехи в края на прането
Проблемът е, че не знам с какъв (вид) алгоритъм да започна. Ако бяхте така добър да прочетете досега, моля, предложете ми нещо (или допълнително четене).
Очевидно не искам нищо подробно, отново само съвети.
Благодаря ти!