Разбиране на разпределението на вероятностите

Какво е разпределение на вероятностите? Какви са различните типове вероятностни разпределения? Как ще помогне при формулирането на решения за наука за данни?.

Нека се опитам да го обясня с много прости думи

Определение:-Вероятностното разпределение е математическата функция, която дава вероятностите за поява на различни възможни резултати за експеримент.

Хвърлянето на зарове ми дава набор от резултати, разпределени по определен начин, където оценките по конкретен предмет от клас ми дават друго разпределение и появата на автомобилни произшествия през определена година следва напълно различно разпределение и т.н. Различните разпределения ни помагат да знаем повече за данните и техните характеристики. Помага да се разбере какъв би могъл да бъде възможният резултат, ако следва определено разпределение.

Вероятностното разпределение е широко класифицирано в дведискретни вероятностни разпределения и непрекъснати вероятностни разпределения.

Дискретни вероятностни разпределения

Когато хвърлите монета, ще имате или глави, или опашки. Вашият резултат е дискретен. Не можете да имате никаква стойност между тях. Тук броят на събитията е дискретна функция. Същото е и с хвърлянето на зарове. Вероятността за хвърляне на конкретно число е дискретна. Вашият резултат ще бъде 1,2,3,4,5 или 6. Дискретният, както подсказва името, има граница за разлика от непрекъснатия. Може да бъде едно или две, когато хвърляте зарове, няма да е 1,5 или 1,22345. Всеки възможен резултат при дискретно разпределение на вероятностите има вероятност за възникване. Биномиално разпределение, Поасоново разпределение, равномерно разпределение и т.н. са примерите за дискретни вероятностни разпределения

Непрекъснати разпределения на вероятностите.

В случай на измерване на височина или тегло на клас, стойностите или резултатите, които наблюдаваме, няма да бъдат дискретно число. Може да са непрекъснати стойности. Теглото на човек може да бъде 48,050, а на друг може да бъде 46,063. Може да се изчисли до толкова десетични знаци, колкото са ви необходими въз основа на скалата на машината, използвана за измерване. Непрекъснатите вероятностни функции са известни също като функции на вероятностна плътност. Сумата от вероятностите в непрекъсната вероятностна функция остава една. Не можем обаче да потвърдим, че всяка възможна стойност/резултат ще има различна от нула вероятност. В функцията за непрекъсната вероятност ние изчисляваме вероятността за възникване между две стойности или точки. Площта под кривата за вероятностна диаграма на непрекъснато вероятностно разпределение е единица. Нормално разпределение, разпределение на Уейбул, лог нормално разпределение са примери за непрекъснати вероятностни разпределения

Сега нека разгледаме подробно разпределенията

Равномерно разпределение

Равномерното разпределение е разпределение, при което всички резултати (между максимална стойност и минимална стойност) имат еднакво вероятна вероятност. Равномерното разпределение може да бъде непрекъснато равномерно разпределение и дискретно равномерно разпределение.

Непрекъснато равномерно разпределение.

Непрекъснатото равномерно разпределение, наричано също правоъгълно разпределение, описва експеримент, при който има произволен резултат, който се намира между определени граници, a и b, които са минималната и максималната стойност.

Влезли сте в апартамента си и се каните да вземете асансьор до вашия етаж. Обаждате се и асансьорът отнема между 0 и 40 секунди, за да стигне до вас, след като натиснете бутона. Това е класически пример за непрекъснато равномерно разпределение с минимална стойност нула и максимална стойност 40 секунди.

Функцията на плътност на вероятността на непрекъснатото равномерно разпределение е

Очакваната стойност на непрекъснатото равномерно разпределение е

Дисперсията на непрекъснатото равномерно разпределение е

В горния проблем E(X) =1/2*(40) = 20s и V(X) = 1/12*(40)²=400/3

Дискретно равномерно разпределение.

Дискретното равномерно разпределение е симетрично вероятностно разпределение, при което е еднакво вероятно да бъдат наблюдавани краен брой стойности; всяка от n стойностите има еднаква вероятност 1/n

Тегленето на сърце, купа, каро или пика от тесте карти е пример за дискретно равномерно разпределение.

Функцията на плътността на вероятността на дискретното равномерно разпределение е

Очакваната стойност на дискретното равномерно разпределение е

Дисперсията на дискретното равномерно разпределение е

В горната задача E(X) =(1+6)/2 = 3,5 и

V(X) = ((6–1+1)²-1)/12=35/12=2.9

Разпределение на Бернули

Разпределението на Бернули е дискретно вероятностно разпределение на случайна променлива, което приема двоичен изход: 1 с вероятност p и 0 с вероятност (1-p). Няколко примера за разпределение на Бернули е, че когато хвърлите монета, ще получите или глави, или опашки, ако свързвате получаването на глави с победа или успех и получаването на опашка със загуба, тогава това е разпределение на Бернули. Същото с успех или неуспех, пол мъжки или женски, издържан или неуспешен изпит и т.н.

Представете си, че получавате глава, докато хвърляте честна монета, се счита за успех, тогава главата се приравнява на 1, а опашката се приравнява на 0 . Вероятността за получаване на глава е 1/2. Вероятността за успех е

Очакваната стойност на случайна променлива на Бернули е

Дисперсията на разпределеното по Бернули X е

Разпределението на Бернули е, когато експериментираме само веднъж, като хвърляне на монета веднъж или хвърляне на зар веднъж. И какво, ако експериментите се повтарят няколко пъти? Разпределението за това е биномно разпределение. Разпределението на Бернули е специален случай на биномно разпределение, при което се провежда единичен опит (така че n ще бъде 1 за такова биномно разпределение).

Биномно разпределение

Биномното разпределение се използва, когато има точно два взаимно изключващи се изхода от изпитание, като глави или опашки при хвърляне на монета, вали или не вали утре, победа или загуба на мач. Тези резултати са подходящо обозначени като „успех“ и „провал“. Биномиалното разпределение се използва за получаване на вероятността за наблюдаване на x успехи в N опити, като вероятността за успех на един опит се обозначава с p . Биномното разпределение предполага, че p е фиксирано за всички опити.

Вероятността за постигане на точно x успехи в n независими опити на Бернули се дава от функцията на вероятностната маса:

Да предположим, че хвърляме монета 6 пъти, ако вероятността да получим глава се счита за успех, а получаването на опашка като провал. Всяко изпитание има вероятност за успех 1/2. Каква ще бъде вероятността да получите глави 4 пъти.

Всеки опит е Бернули и вероятността за възникване е p

Получаването на 4 глави при хвърляне на монета 6 пъти е 6c4. Което е равно на 15 и вероятността за успех е 1/64. P(X=4) = 15/64

Ако X ~ B(n, p), тоест X е случайна променлива с биномно разпределение, като n е общият брой експерименти и p е вероятността всеки експеримент да даде успешен резултат, тогава очакваната стойност на X е:

Дисперсията на биномното разпределение е

Разпределение на Поасон

Вече знаем как работи двоичното разпределение. Представете си случай, в който броят на събитията е близо до безкрайност или е много много голям брой, а също така вероятността за събитие е много много ниска или близо до нула, като брой имейли, които получавате за една година, брой искове за злополука, които застраховката компанията получава и т.н. В горните случаи може да нямате точна стойност „n“ и „p“, но знаете, че n е близо до безкрайност и p е близо до нула. В такива случаи използваме разпределението на Поасон. В разпределението на Поасон разглеждаме параметъра λ.

Процесът на Поасон е модел за поредица от дискретни събития, при които средното време между събитията е известно, но точното време на събитията е произволно. Пристигането на събитие е независимо от събитието преди това.

Разпределението на Поасон е разпределението, което изразява вероятността даден брой събития да се случват във фиксиран интервал от време или пространство, ако тези събития се случват с известна постоянна средна скорост и независимо от времето след последното събитие.

Когатоλстане по-голямо, графиката изглежда повече като нормално разпределение

Казва се, че дискретна случайна променлива X има разпределение на Поасон с параметър λ › 0, ако за k = 0, 1, 2, … , вероятностната масова функция на X се дава от

Разпределението на Поасон може да се приложи към системи с голям брой възможни събития, всяко от които е рядко.

Положителното реално число λ е равно на очакваната стойност на X, а също и на неговата дисперсия

Нормално разпределение

Нормалното разпределение е най-често срещаното разпределение, което виждаме в ежедневието си. Има много примери около нас за това разпределение, което по друг начин се нарича Бел-крива като разпределение на ръстовете на учениците в разговорите, кръвното налягане, грешката на измерване и IQ резултатите.

Функцията за плътност на вероятността на нормалното разпределение е

Параметърът μ е средната стойност или очакването на разпределението (а също и неговата медиана и мода), докато параметърът σ е неговото стандартно отклонение. Дисперсията на разпределението е σ^2

Емпиричното правило на нормалното разпределение е, че стойностите от 68,27% са в рамките на едно стандартно отклонение, стойностите от 95,45% са в рамките на две стандартни отклонения и стойностите от 99,73% са в рамките на две стандартни отклонения

Гама разпределение

Какво е гама разпределение? Къде се използва? Гама разпределението помага да се предскаже времето за изчакване до настъпването на n-то събитие. Гама разпределението има два параметъра, алфа-който представлява формата и бета- който представлява мащаба. Параметърът на формата, както подсказва името, определя формата на разпределението, а параметърът на мащаба определя статистическата дисперсия. Ако s е голям, тогава разпределението ще бъде по-разпръснато; ако s е малък, тогава ще бъде по-концентриран. Няколко примера за гама разпределение са количеството на валежите, натрупани в резервоар, размерът на просрочените заеми или общите застрахователни искове, натоварването на уеб сървърите и т.н.

Функцията на плътността на вероятността на гама разпределението е

Средната стойност на гама разпределението е

Дисперсията на гама разпределението е

Обобщение

Покрих основните дистрибуции, които са полезни за специалистите по данни при техния анализ и моделиране. Моля, споделете вашите мисли и въпроси в секцията за коментари. Ще се радвам да отговоря на вашите въпроси.

Препратки:-