Свързани публикации 'statistical-analysis'


Линейна регресия: Математическа интуиция
От началото на вашето пътуване като специалист по данни, вие обикновено сте свикнали с този алгоритъм за машинно обучение. Линейна регресия, тъй като това е основният и най-важен алгоритъм за машинно обучение, с който обикновено започваме, докато анализираме различни проблеми с регресията. Както казва думата линейно, линейната връзка между входните променливи (x) и зависимата изходна променлива (y). По принцип линейният регресионен анализ изпълнява задачата за прогнозиране на..

Нива на изследване на статистиката за анализ на данни
За да се извърши статистически анализ на данните, е важно да се разберат различните нива на изследване, които съществуват. За да се извърши статистически анализ на данните, е важно да се разберат различните нива на изследване, които съществуват. За да направи това, Габриел Мендоса, професор по онлайн курса Статистически основи за анализ на данни, обяснява с кратък пример какъв тип информация може да бъде получена на всяко от тези нива: 1. Проучвателна та 2. Описателна та 3...

Основи на RoC кривата и AUC резултат
Основи на RoC кривата и AUC резултат RoC кривата означава крива на работните характеристики на приемника, а AUC означава площ под кривата За да разберем напълно RoC кривата и AUC резултата, трябва да разберем матрицата на объркването. Матрицата на объркване е матрица с размерност 2X2 между Действително +/- и Тест +/-. Въпреки това можем да обменяме между True и Test. Когато действителните + и - имат едни и същи стойности в теста, това се означава съответно като истински положителен и..

Корелационна матрица: -
Въведение: Какво е корелационна матрица? Корелационната матрица е матрица, която показва корелацията между променливите. Той дава корелацията между всички възможни двойки стойности в матричен формат. Можем да използваме корелационна матрица, за да обобщим голям набор от данни и да идентифицираме моделите и да вземем решение според тях. Можем също да видим коя променлива е по-корелирана с коя променлива и можем да визуализираме нашите резултати. Корелационната матрица..

Техники за извадка по важност и намаляване на дисперсията
Базираните на извадки методи са повсеместни в компютърните науки, статистиката, машинното обучение, оперативните изследвания и други области. Директното вземане на проби от желано вероятностно разпределение обаче може да не винаги е осъществимо или ефективно поради високата си дисперсия, което води до неточни оценки. За справяне с този проблем са разработени извадки по важност и други техники за намаляване на дисперсията. Извадка по важност Извадката по значимост е метод, използван..

ANOVA — Кратък преглед и неговите реализации
Anova или ANalysis Of VAriance ни позволява да преминем отвъд сравняването само на две популации. С Anova можем да сравняваме множество популации, а също и техните подгрупи. С помощта на Anova можем да проверим дали средните стойности на две или повече групи се различават значително една от друга. Защо Anova? В този момент сравнявахме две популации от независими проби (случаен t-тест) и t-тест за сдвоени проби. Бяхме се ограничили да сравняваме две популации и повече. В случай, че..

Разбиране на линейната регресия и нейното използване при прогнозиране на непрекъснати променливи.
Линейната регресия е техника за статистическо моделиране, използвана за откриване на връзката между зависима променлива и независима променлива. Той е прост, но мощен и е един от най-използваните алгоритми в машинното обучение. Във финансите се използва за прогнозиране на цените на акциите и лихвените проценти, в здравеопазването се използва за прогнозиране на резултатите на пациентите въз основа на различни фактори, наскоро за анализиране на въздействието на пазарните кампании върху..