Коя задача за извличане на данни за извличане на уникален екземпляр

Работя с извличане на данни и съм запознат със задачите за класификация, групиране и регресия. В класификацията човек може да има много екземпляри (напр. животни), техните характеристики (напр. брой крака) и клас (напр. бозайник, влечуго).

Но това, което трябва да постигна, е, като се имат предвид някои атрибути, включително атрибута клас, да определя кой уникален екземпляр имам предвид (напр. жираф). Мога да предоставя всички известни атрибути, които имам, и ако моделът не може да разбере отговора, може да поиска друг атрибут – точно аналогично на стил на игра с 20 въпроса.

И така, въпросът ми е: тази конкретна задача има ли име? Изглежда, че е подобно на класификацията, където класът е уникален за всеки екземпляр, но това не би паснало на настоящите модели за обучение, освен може би за модел на дърво на решенията.


person Chaotic    schedule 28.04.2014    source източник


Отговори (2)


Вашите входове, обозначени като характеристики в машинното обучение, са набори от видове (това, което мисля, че имате предвид под „екземпляр“) и физически атрибути. Вашите резултати са по-широки таксономични рангове. По този начин присвояването на един на всеки вход е проблем с класификацията. Тъй като характеристиките ви са непълни, вие искате да извършите... класификация с непълни данни или применяване на липсващи характеристики. Търсенето на тези термини ще ви даде достатъчно потенциални клиенти.

(И другата задача правилно се нарича групиране.)

person Emre    schedule 28.04.2014
comment
Актуализирах въпроса си с тези няколко промени в термина. Но не мисля, че това е точно проблем с класификацията, защото не бихте могли да обучите модел да предвиди към кой клас принадлежи нов екземпляр (кортеж), ако атрибутът на класа е уникален (като ID). - person Chaotic; 29.04.2014
comment
Класовият атрибут не е ли таксономична група, свързана с вида? Не разбирам какво имате предвид, когато казвате, че е уникален. Настройката за задаване на въпроси за насочване на обучаемия напомня за активно обучение. - person Emre; 29.04.2014

IMHO търсите просто дърво за вземане на решения.

С изключение на това, че не го обучавате на вашия категориален атрибут (вашият "клас"), а на отделния етикет на екземпляра.

Все пак трябва внимателно да изберете мярката за разделяне, тъй като много мерки се отнасят за размерите на класовете - и всичките ви класове вече имат размер 1. Намирането на добро разделение за дървото на решенията може да включва планиране на някои разделяния напред, за да получите оптимално балансирано дърво. Подход, подобен на произволна гора, може да бъде полезен за подобряване на шанса за намиране на добро дърво.

person Has QUIT--Anony-Mousse    schedule 01.05.2014