Публикации по темата statistics

Свързани публикации 'statistics'

Логистична регресия: вероятностен подход

Логистична регресия: вероятностен подход Как естествено се оказваме с логистична регресия, когато се опитваме да намерим алгоритъм за двоична класификация? Когато започнах машинното си обучение, повечето въвеждащи курсове онлайн не предоставиха подходяща обосновка за много въпроси, които имах относно двоичната класификация — Защо да използвате функцията Sigmoid? Как стигнахме до този алгоритъм? Това беше нещо, което беше отхвърлено, като се каза, че Sigmoid е начин да..

Математиката зад градиентно спускане

В предишната и първата статия от поредицата „The Maths Behind“ обсъдихме линейната регресия. В този ще разберем какво е градиентно спускане и как работи, очевидно с помощта на математика, о! Добре, така че първо и най-важно какво е Gradient Descent? Нека обясня. По същество това е метод за оптимизация, при който намираме локалните или глобалните минимуми (в зависимост от кривата) на дадена крива чрез произволно избиране на постоянните параметри и постепенно придвижване надолу, докато..

Прецизност или припомняне Кога да избера какво? Може ли F1-Score да помогне?

Точността добра мярка ли е? Когато говорим за измерване на производителността на класификационен модел на машинно обучение, първият термин, който ни идва наум, е Точност , който е много прост, но много мощен. Но може ли точността наистина да помогне за разбирането на модела във всеки сценарий? Отговорът е Не . Нека да видим кога точността може да не покаже дали даден модел е добър или не. Сега нека приемем, че моделът, който тестваме, е „ тъп модел“. Това означава, че в..

Разбиране и решаване на въпроси с хипотези с лекота

Тестването на хипотези е част от инференциалната статистика, където работим върху извадка и популация. Хипотезата е просто твърдение или изявление относно параметър на популацията, като средна популация, пропорция на дисперсията и т.н. Обикновено изследваме твърдението, като не влизаме в лаборатория, както правим в други експерименти, но това, което правим, е да избираме проба от популацията и получаваме данните и чрез изучаване на извадка изучаваме популацията. Накратко, нека разберем..

Нива на изследване на статистиката за анализ на данни

За да се извърши статистически анализ на данните, е важно да се разберат различните нива на изследване, които съществуват. За да се извърши статистически анализ на данните, е важно да се разберат различните нива на изследване, които съществуват. За да направи това, Габриел Мендоса, професор по онлайн курса Статистически основи за анализ на данни, обяснява с кратък пример какъв тип информация може да бъде получена на всяко от тези нива: 1. Проучвателна та 2. Описателна та 3...

Основи на RoC кривата и AUC резултат

Основи на RoC кривата и AUC резултат RoC кривата означава крива на работните характеристики на приемника, а AUC означава площ под кривата За да разберем напълно RoC кривата и AUC резултата, трябва да разберем матрицата на объркването. Матрицата на объркване е матрица с размерност 2X2 между Действително +/- и Тест +/-. Въпреки това можем да обменяме между True и Test. Когато действителните + и - имат едни и същи стойности в теста, това се означава съответно като истински положителен и..

Граматичните термини в Dispersion : какво представляват те и бързите формули

Дисперсията се използва за определяне на несигурността в данните или за да се види дали информацията е разпръсната. Това предполага, най-общо, липсата на еднаквост в размера на поредица от елементи. Когато дисперсията или липсата на еднаквост в размера на елементите в последователност е голяма, дисперсията се счита за значителна. Когато дисперсията е ниска, повечето точки от данни са близо до типичната стойност, централната тенденция е по-надеждна или по-отразяваща данните, което води до..