Защо се нуждаем от soft-margin, ако използваме ядро ​​в SVM?

Знам, че идеята за използване на ядро ​​в SVM е да се трансформират точките от данни в пространство с безкрайно измерение, където точките могат да бъдат линейно разделими. По този начин можем да намерим максимална граница, която разделя точките. Но защо тогава трябва да използваме мек маржин, ако можем да разделим всички точки?! Доколкото знам, идеята зад мекия марж е, че ако не сме в състояние да разделим напълно всички точки, намираме възможно най-добрия марж. Така че, ако използваме функцията на ядрото, цялата идея за мек марж няма смисъл за мен. И така, каква е идеята?!


person Jack Twain    schedule 17.04.2014    source източник
comment
не съм сигурен за дублиране. това е различен начин да питате, който стига до едни и същи отговори   -  person Nicolas78    schedule 18.04.2014


Отговори (2)


Дори и да успеете да създадете идеално пасваща разделяща хиперравнина, тя може да е прекалено сложна и по този начин склонна към Прекомерно оборудване. Едно от предимствата на SVM е, че формулировката с меки граници съвсем естествено предоставя възможност за мащабиране между прецизност и обобщение.

person Nicolas78    schedule 17.04.2014
comment
вижте този въпрос stackoverflow.com/questions/4629505/svm- hard-or-soft-margins за много по-подробен отговор на не напълно идентичен, но свързан въпрос - person Nicolas78; 17.04.2014

Възможно е да имате дубликати с различни етикети. Тогава е доста очевидно, че не можете да намерите равнина, която разделя вашите данни.

Class A:  (3,3) (2,2) (1,1)
Class B:  (0,0) (1,1) (2,2)

Мекият марж все още ще даде разумен резултат при противоречив набор от данни. В действителност данните не се държат добре и трикът на ядрото не винаги може да ги направи линейно разделими. Някои данни просто се разделят трудно.

person Has QUIT--Anony-Mousse    schedule 18.04.2014