Свързани публикации 'principal-component'
Наука за данни: Изчисляване на собствени вектори — Кръгове на Гершгорин.
Присъединете се към Medium с моята реферална връзка - apply.math.coding Получете достъп до всичките ми истории и до хиляди други в Medium от други писатели. Както силно вярвам, Medium е... applied-math-coding.medium.com
Тази история е част от моята поредица Наука за данни .
Важна техника за разбиране в областта на статистиката и науката за данни….PCA
Здравейте на всички, объркани ли сте какво е това PCA? Искате ли да научите повече за това? Нека се запознаем с PCA в тази статия.
Преди да започнем с PCA, нека се запознаем с машинното обучение.
Машинно обучение:
Машинното обучение е подполе на изкуствения интелект (AI) и компютърните науки, което използва данни и алгоритми, за да имитира начина, по който хората учат, като постепенно подобрява своята точност.
Това означава, че е метод за анализ на данни, който автоматизира..
Наука за данни: Изчисляване на собствени вектори — Реализация на QR-алгоритъм.
Присъединете се към Medium с моята реферална връзка — apply.math.coding Получете достъп до всичките ми истории и до хиляди други в Medium от други писатели. Както силно вярвам, Medium е... applied-math-coding.medium.com
Тази история е част от моята поредица Наука за данни .
Анализ на основните компоненти от нулата в Python
Какво всъщност е PCA?
Това е един от най-важните алгоритъм в ML за намаляване на размери (атрибути/колони). Той използва прости операции от ред.
Той използва статистика за изчисляване на проекция на оригиналните данни в същия брой или по-малко измерения. PCA е представена от m x n матрица A.
Матрица A, която води до проекция на A, която ще извика B.
A= ( a11 ,a12
a21, a22
a31, a32)
B = PCA (A)
Стъпки, които трябва да следвате, за да направите анализ с помощта на PCA..
Маурицио Сари и намаляването на размерността
Пътуване през анализ на основните компоненти с треньор Маурицио Сари
Маурицио и светът в неговите бележки
Маурицио Сари винаги е бил педантичен и ориентиран към детайлите треньор. Той се гордее с работата си и винаги търси начини да се подобри. Един ден, след особено предизвикателен мач, той откри, че размишлява върху това, което се е оправило и кое се е объркало. Докато мислеше за различните игри и стратегии, които бяха използвани, той осъзна...
Намаляване на размерността „зад кулисите“: как работят най-популярните алгоритми?
Нека започнем с примерен набор от данни, съдържащ генна експресия върху здрави белодробни тъкани за 604 пациенти.
В този пример всеки ред представлява генната експресия за всеки пациент, а всяка колона представлява експресията на всеки ген при пациенти. Както можем да видим в описанието в долната част на таблицата, имаме p=16470 атрибути или функции за всеки от n=604 пациенти. Имайте предвид, че в този пример има много повече характеристики от пациентите, често срещан..
Премахнете Curse of Dimensionality с помощта на Principal Component Analysis (PCA)
По принцип, ако имаме огромно количество необработен набор от данни с голямо измерение, върху който да работим, най-вече имаме много непоследователни и излишни функции, които няма да са много полезни за данните, но може не само да увеличат времето за изчисление, но и да усложнят по време на проучвателния анализ на данни и обработка на данни. Това явление се нарича Проклятие на размерността. За да преодолеем този проблем, трябва да намалим/премахнем функции, които не са важни, можем да..