Използване на модел на гаусова смес за етикетирани и немаркирани данни в scikit learn?

Имам данни, от които част от тях са етикетирани, а част от тях не са етикетирани. Трябва да приложа алгоритъма за максимизиране на очакванията. Възможно ли е да се приложи в Sci-kit learn? Всеки пример за етикетирани + немаркирани екземпляри би бил полезен.


person user2793286    schedule 01.04.2015    source източник


Отговори (1)


Не точно. Scikit-learn предоставя повече алгоритми за черна кутия. GMM обикновено не се смятат за контролирани модели. Въпреки това да напишете EM сами трябва да е доста лесно. Можете да опитате да хакнете изпълнението на sklearn, но в този случай писането на собствено може да е по-лесно.

person Andreas Mueller    schedule 01.04.2015
comment
Въпросът на OP е малко неясен, но какво не е наред с използването на scikits модел на сместа на Гаус? Означените данни на OP са, предполагам, неговите данни за обучение и прилагане на научения модел върху немаркираните примери? - person AGS; 02.04.2015
comment
GMM модулът не се контролира и не приема никакви етикети при монтажа. - person Andreas Mueller; 02.04.2015
comment
Но ако приемем, че не пропускате никакви класове във вашите етикетирани данни, тогава знаете колко състояния да обучите модела, нали? - person AGS; 02.04.2015
comment
Да, но вие не използвате информацията на етикета. - person Andreas Mueller; 02.04.2015
comment
Всъщност бихте могли да поставите GMM, като използвате фиксирани индикатори заедно с данни без индикатори, за да научите модел. Това си мислех, че ОП пита. - person Andreas Mueller; 02.04.2015
comment
Добре разбира се.. Благодаря.. Изпълнението на E-M изглежда лесно. - person user2793286; 03.04.2015