Свързани публикации 'dimensionality-reduction'


Обяснени самоорганизиращи се карти
Самоорганизиращите се карти (SOM), известни още като карти на Кохонен, са вид изкуствена невронна мрежа, която се използва за групиране, намаляване на размерността и др. В първата част предоставям общ преглед на SOM. Във втората част обяснявам как се учат. И накрая, в последната част демонстрирам как да обучавам SOM ​​върху набора от данни за ириса. Чувствайте се свободни да прескочите напред до последния раздел, ако предпочитате. TL;DR: SOM картографират високоразмерни входни..

Какво е проклятието на измерението?| Машинно обучение #2
Визуализирането на стоизмерното пространство е невероятно трудно за хората. Освен че са трудни за визуализиране, има поне два допълнителни проблема във високите измерения, и двата наричани проклятието на размерността . Единият е изчислителен, другият е математически. От изчислителна гледна точка разгледайте следния проблем. За K -най-близките съседи скоростта на прогнозиране е ниска за много голям набор от данни. Най-малкото трябва да разглеждате всеки пример за обучение всеки..

Намаляване на размерността и машинно обучение
Помага на машинното обучение при получаването на прогнозни модели с добро съответствие. Намаляването на размерността е област на машинното обучение и изкуствения интелект. Както знаем, в машинното обучение за всяка класификация се вземат предвид много фактори преди резултата. И тези фактори не са нищо друго освен променливите, които също се наричат ​​характеристики. Но въпросът тук е какво точно прави намаляването на размерността в машинното обучение. Отговорът на този въпрос би..

Методи за намаляване на размерите
Намаляването на размерите е техника, която намалява броя на входните променливи в конкретен набор от данни, сега тук възниква въпросът защо трябва да намаляваме размерите на данните. Намаляването на размерите на данните намалява необходимото време и място за съхранение. Помага за премахване на мултиколинеарността, което подобрява интерпретацията на параметрите на модела за машинно обучение. Защото тогава става по-лесно да се визуализират данните, когато са намалени до по-ниски измерения...

3 лесни стъпки за извършване на намаляване на размерността с помощта на анализ на основните компоненти (PCA)
Изпълнението на PCA алгоритъма два пъти е най-ефективният начин за изпълнение на PCA Каква е размерността на набор от данни? В контекста както на статистиката, така и на машинното обучение, размерността на набора от данни се отнася...

Намаляване на размерността „зад кулисите“: как работят най-популярните алгоритми?
Нека започнем с примерен набор от данни, съдържащ генна експресия върху здрави белодробни тъкани за 604 пациенти. В този пример всеки ред представлява генната експресия за всеки пациент, а всяка колона представлява експресията на всеки ген при пациенти. Както можем да видим в описанието в долната част на таблицата, имаме p=16470 атрибути или функции за всеки от n=604 пациенти. Имайте предвид, че в този пример има много повече характеристики от пациентите, често срещан..

PCA срещу LDA — Без повече объркване!
Намаляването на размерността е обичайна техника, използвана при анализа на данни, за да се намали броят на променливите или характеристиките в набор от данни, като същевременно се запази възможно най-много информация. Има няколко метода за намаляване на размерността, но в тази статия ще се съсредоточим върху линейния дискриминантен анализ (LDA) и анализа на основните компоненти (PCA), техните концепции и разлики. Анализ на основните компоненти (PCA) PCA е неконтролиран метод за..