Свързани публикации 'hypothesis-testing'


Вашият модел най-добрият ли е или най-щастливият?
Как да не бъдете подведени от случайността, когато избирате най-добрия модел Свикнали сме да виждаме предизвикателства в науката за данните в Kaggle, където вариация от 0,1% в ROC резултата може да направи разликата между спечелването на 100 000 $ или нищо. Вземете за пример предизвикателството Data Science Bowl 2017 . Наградите бяха 500 000 $ за 1-во място, 200 000 за 2-ро място, 100 000 за 3-то място и т.н. Избраният показател за оценка беше логаритмична загуба. Това беше..

Разбиране и решаване на въпроси с хипотези с лекота
Тестването на хипотези е част от инференциалната статистика, където работим върху извадка и популация. Хипотезата е просто твърдение или изявление относно параметър на популацията, като средна популация, пропорция на дисперсията и т.н. Обикновено изследваме твърдението, като не влизаме в лаборатория, както правим в други експерименти, но това, което правим, е да избираме проба от популацията и получаваме данните и чрез изучаване на извадка изучаваме популацията. Накратко, нека разберем..

Какво представляват грешки от тип I и тип II?
Нека първо разберем хипотезата NULL(H0) и ALTERNATE(HA) : Тук предположението трябва да се направи за съвкупността, а не за извадката. Първоначално приемаме, че нулевата хипотеза е вярна . Въз основа на резултата от статистическите тестове или ние „ отхвърляме нулевата хипотеза“ или „ не успяхме да отхвърлим нулевата хипотеза“ . Грешка тип I: Отхвърляне на нулевата хипотеза, когато е вярна Грешка от тип II: Неотхвърляне на нулевата хипотеза, когато е невярна..

Изследване на P-стойността в статистиката и машинното обучение
В областта на машинното обучение разбирането и използването на p-стойността е съществена част от прогнозирането на успеха или неуспеха на даден алгоритъм. Разбирането на това статистическо измерване може да ви помогне да станете по-компетентни с вашите ML модели и да интерпретирате данните, които произвеждат. В тази публикация в блога разглеждаме по-отблизо какво представлява p-стойността и обсъждаме как най-добре да я използвате във вашите ML проекти. Каква е P-стойността?..

A/B тестване : Подход на Python (част 1)
Тази статия е за хора, които искат да научат как да прилагат A/B тестване. Ако искате да получите обобщение на A/B тестването, моля, проверете другата ми статия . Преглед Наборът от данни на Cookie Cats е от предизвикателство на Kaggle. Това е мобилна пъзел игра, в която плочките от един и същи цвят трябва да бъдат свързани, за да изчистите дъската и да спечелите нивото. След преминаване на различни нива има поставени врати, които обикновено са там, за да показват на потребителите..

Тестове на хипотези с Python
В предишната си „статия“ говорих за статистически тестове на хипотези. Те са ключови в статистиката и науката за данните, тъй като винаги сме помолени да „обобщим“ огромното количество данни, които искаме да анализираме в проби. Веднъж предоставени проби, които могат да бъдат подредени с различни техники, като „извадка от Bootstrap“, общата цел е да се направят изводи по реални параметри, принадлежащи на оригиналните популации, чрез изчисляване на така наречените статистики или оценители..