Тестването на хипотези е част от инференциалната статистика, където работим върху извадка и популация. Хипотезата е просто твърдение или изявление относно параметър на популацията, като средна популация, пропорция на дисперсията и т.н. Обикновено изследваме твърдението, като не влизаме в лаборатория, както правим в други експерименти, но това, което правим, е да избираме проба от популацията и получаваме данните и чрез изучаване на извадка изучаваме популацията. Накратко, нека разберем този начин чрез вземане на проби и получаване на информация за примерния набор от данни и след това тестване на хипотезата, използвана за изследване на популацията, така че когато говорим за разследване на иск с тестване на клиент, ние говорим за правене на проби и получаване на информация и след това тестване на хипотезата, за да се провери направеното твърдение.

когато прочетете проблема, трябва да изберете хипотезата от него, да разберете какво всъщност се интересуват от изучаването и след това да разберете тестовете, които трябва да получите там, така че това е хипотеза, сега ще говорим за нещо, наречено нулева хипотеза сега какво мислите, че думата не означава за тези, които учат математика или програмиране или нещо не просто обикновено означава нула понякога може да е 0 нещо празно, но като цяло говорим за нулевата хипотеза това, за което говорим е тази хипотеза по подразбиране. Нека разберем какво означава нулева хипотеза и алтернативна хипотеза:

Нулева хипотеза: Нулева хипотеза е твърдение за популация, която искате да тествате. То е „нулево“ в смисъл, че често представлява убеждение за статуквото, като например липсата на характеристика или липсата на ефект. Може да се формализира, като се твърди, че параметър на популацията или комбинация от параметри на популацията има определена стойност. В примера, даден в „Тестване на хипотези“, нулевата хипотеза би била, че средната цена на газа в щата е била 1,15 долара. Това е написано H0: µ = 1,15.

Алтернативна хипотеза: Алтернативна хипотеза е контрастиращо твърдение за съвкупността, което може да бъде тествано спрямо нулевата хипотеза. В примера, даден в „Тестване на хипотези“, възможните алтернативни хипотези са:

H1: µ ≠ 1,15 — Средната стойност за държавата е различна от $1,15 (двустранен тест)

H1: µ › 1,15 — Средната стойност за държавата е по-голяма от $1,15 (тест за дясната опашка)

H1: µ ‹ 1,15 — Средната стойност за държавата е по-малко от $1,15 (тест за лява опашка)

P-стойност: p стойността на тест е вероятността, съгласно нулевата хипотеза, да се получи стойност на статистиката на теста като екстремна или по-екстремна от изчислената стойност от пробата.

Ниво на значимост: Нивото на значимостна тест е праг на вероятност α, за който е съгласувано преди провеждането на теста. Типичната стойност на α е 0,05. Ако стойността на p на даден тест е по-малка от α, тестът отхвърля нулевата хипотеза. Ако стойността на p е по-голяма от α, няма достатъчно доказателства за отхвърляне на нулевата хипотеза. Имайте предвид, че липсата на доказателства за отхвърляне на нулевата хипотеза не е доказателство за приемане на нулевата хипотеза. Също така имайте предвид, че съществената „значимост“ на дадена алтернатива не може да бъде изведена от статистическата значимост на даден тест.

Z-резултат: Z-резултат измерва разстоянието между точка от данни и средната стойност, като използва стандартни отклонения. Z-резултатите могат да бъдат положителни или отрицателни. Знакът ви казва дали наблюдението е над или под средната стойност. Например z-резултат от +2 показва, че точката от данни пада с две стандартни отклонения над средната стойност, докато -2 означава, че е с две стандартни отклонения под средната стойност. Z-резултат нула е равен на средната стойност. „Z-резултатите“ се наричат ​​също „стандартни резултати“.

Доверителен интервал: Доверителният интервал е приблизителен диапазон от стойности с определена вероятност да съдържа истинската стойност на популацията на параметър. Горните и долните граници за доверителните интервали се изчисляват от извадковата оценка на параметъра и известното (или предполагаемо) извадково разпределение на оценителя. Типично предположение е, че оценките ще бъдат нормално разпределени с многократно вземане на проби (както е продиктувано от Централната гранична теорема). По-широките доверителни интервали съответстват на лоши оценки (по-малки извадки); тесните интервали съответстват на по-добри оценки (по-големи проби). Ако нулевата хипотеза потвърждава стойността на параметър на популацията, тестът отхвърля нулевата хипотеза, когато хипотетичната стойност е извън изчисления доверителен интервал за параметъра. Резултатите от тестовете на хипотези често се съобщават с доверителен интервал

Тестване на хипотеза: Когато тестваме хипотеза, приемаме, че нулевата хипотеза е вярна, докато в извадката има достатъчно доказателства, които да докажат, че е невярна. В този случай отхвърляме нулевата хипотеза и подкрепяме алтернативната хипотеза. Ако извадката не успее да предостави достатъчно доказателства, за да отхвърлим нулевата хипотеза, не можем да кажем, че нулевата хипотеза е вярна, защото се основава само на данните от извадката. За да кажем, че нулевата хипотеза е
вярна, ще трябва да проучим данните за цялото население.

Видове тестове: едностранни и двустранни тестове

Ако алтернативната хипотеза дава алтернативата в двете посоки (по-малка и по-голяма от) на стойността на параметъра, определен в нулевата хипотеза, тя се нарича двустранен тест.
Ако алтернативната хипотеза дава алтернативната само в една посока (или по-малко от, или по-голямо от) от стойността на параметъра, посочен в нулевата хипотеза, това се нарича Едноопашен тест.
напр. ако H0: средна стойност= 100 H1: средна стойност не е равна на 100, тук според H1 средната стойност може да бъде по-голяма или по-малка от 100. Това е пример за двустранен тест. По същия начин, ако H0: средна стойност›=100, тогава H1: средна стойност ‹ 100
Тук средната стойност е по-малка от 100, нарича се едностранен тест.

Нека разрешим някои въпроси, за да разберем концепцията,

Въпрос: Компания е използвала конкретна марка тръбни светлини в миналото със среден живот от 1000 часа. Нова марка се обърна към компанията с нови тръбни светлини със същата мощност на по-ниска цена. За тестване бяха взети проби от 120 крушки, които дадоха средно 1100 часа със стандартно отклонение от 90 часа. Трябва ли компанията да даде договора на тази нова компания на ниво на значимост от 1%. Намерете и доверителния интервал.

Решение: Тук средна стойност на популацията = 1000, средна стойност на извадката = 1010, ниво на значимост = 1% = 0,01, размер на извадката = 120, стандартно отклонение на извадката = 90, H0; среден живот на тръбните светлини ≥ 1000, H1; среден живот на тръбните светлини ‹ 1000

Сега размерът на извадката е голям с неизвестна вариация на популацията. Тъй като не знаем за нормалността на данните, ще използваме z-теста.

Стандартна грешка (SE) = стандартно отклонение на извадката/(размер на извадката)* 0,5

= 90/(120)*0.5 = 8.22

Z(тест) = (извадкова средна стойност — средна популация)/(SE)

= (1010–1000)/8.22 =1.22

нека намерим критичната стойност при значително ниво от 1%, използвайки таблицата с критични стойности.

Z(0,01%)=-2,33(тъй като това е тест с лява опашка) Можем ясно да видим, че Z(тест) ›Z (0,01%), което означава, че нашата тестова стойност не се намира в областта на отхвърляне. По този начин не можем да отхвърлим нулевата хипотеза, т.е. компанията може да даде договора на ниво на значимост от 1%. Разгледайте теста с лявата опашка в диаграмата по-долу

Използване на p-стойност за тестване на горната хипотеза:

p-стойност = P[T‹1,22]

p-стойност = 0,88, Тук p-стойността е по-голяма от нивото на значимост от 1%. Така че не отхвърляме нулевата хипотеза. (Забележка: Таблиците, използвани за изчисления, са достъпни онлайн).

Надявам се, че сте получили добра информация за тестването на хипотези, опитайте се да разрешите още някои проблеми, за да разберете концептуално теорията. Благодаря за четенето.