„Наука за данни“, „Редакция“, „Статистика“

Гмуркане в разпределението на Поасон и процеса на Поасон

Каква роля играят разпределението на Поасон и процесът на Поасон в вероятностите и статистиката и как се използват в сценарии от реалния живот?

Автор(и):Сания Парвиз, Роберто Ириондо



В тази статия ще се потопим в процеса на Поасон и разпределението на Поасон. Ще покажем някои подходящи статистически концепции, последвани от сценарии от реалния свят и примери с реализация на Python. Не забравяйте да проверите цялата реализация от този урок в Google Colab или Github.

Използвахме оптимизация на естествен език в тази статия, за да оптимизираме изживяването и настроението на нашите читатели. Моля, уведомете ни, ако имате обратна връзка дали искате да видите повече от тази оптимизация.

Разпределението на Поасон алтернативно се извлича от биномно разпределение. Това е вероятностно разпределение, използвано в статистическа работа, използвано в ситуации, в които вероятността да се случи събитие е рядка. Следователно разпределението се използва за описание на поведението на редки събития [1].

Много експериментални ситуации възникват, когато наблюдаваме броя на събитията в рамките на набор от време, площ, дължина и т.н. Това е дискретно разпределение на вероятностите и се използва широко в статистическата работа. Използва се в ситуации, когато вероятността за събитие е малка, т.е. събитието се случва рядко [2].

Разпределението на Поасон е създадено след френския математик Симеон Поасон през 1837 и първото му приложение е описанието на броя на смъртните случаи от ритане на коне в Прусия армия[11].

Уравнението на разпределението на Поасон може да се опише като:

Където
P(X=x)представлява вероятността за постигане на x брой успехи.
m = npозначавапараметрите на разпределението.
e = 2.71828формираоснова на естествените логаритми [3].

В това уравнение e е известната умбра от смятането, показано по-долу:

В обобщение:

Разпределението на Поасон се използва за преброяване - т.е., за да се види дали събитията се случват с постоянна скорост във времето. Разпределението на Поасон ни дава вероятността за Xброй събития, настъпили във време T.

Пример:

Моделите на разпределение на Поасон се считат за броя на новите случаи на SARS при жени в Нова Англия следващия месец. Разпределението показва вероятността за всички възможни бройки нови случаи, от 0 до безкрайност.

Следователно дефинирането на горния пример в уравнението на разпределението на Поасон:

Нека X= брой нови случаи следващия месец и X~Поасон (λ), тогава вероятността X = k (специален брой) е:

Пример:

Да приемем, че вирусът се среща при 1 на 1000 души годишно. Ако предположим, че членовете на популацията са засегнати независимо, намерете вероятността за k случая в популация от 10 000 (проследени в продължение на 1 година) за k=0,1,2 [4].

Очакваната стойност (средна) = l = .001*10 000 = 10

Следователно се очакват десет нови случая в тази популация на година въз основа на следното изчисление:

Използване на разпределението на Поасон

Това са някои примери, когато разпределението на Поасон може да бъде практично:

  • По време на статистически контрол на качеството за преброяване на броя на дефектите на артикул или набор от артикули.
  • В областта на биологията, за изчисляване на броя на бактериите.
  • В застраховането, за изчисляване на броя на потенциалните жертви.
  • Да се ​​преброи броят на загубите на силно натоварена магистрала поради пътни произшествия.
  • Да преброим броя на самоубийствата, извършени от любовна точка за една година.
  • Да събере броя на клиентите, пристигащи на портал за електронна търговия.
  • За изчисляване на броя на дефектите в определено измерване във фиброоптичен кабел.
  • За изчисляване на броя радиоактивни частици, открити за даден период от време.
  • За изчисляване на броя на фотоните, достигащи до CCD пиксел за известно време на експозиция.
  • (напр. астрономически наблюдения).
  • Да се ​​изчисли броя на пациентите в чакалня за час.
  • За изчисляване на броя клиенти, които се обаждат, за да се оплачат от услуга или продукт на месец.

Можем да използваме метод на Поасонова точка, тъй като броят на събитията, случващи се в този интервал, отразява разпределението на Поасон за всеки фиксиран интервал от време. От друга страна, продължителността на времето между следващите събития следва експоненциално разпределение, което показва тясна математическа връзка между Поасон и експоненциалното разпределение [1].

Стъпки за изчисляване на Поасоново разпределение

Това са стъпките за изчисляване на разпределението на Поасон:

Стъпка 1: Изчислете средната стойност от данните за наблюдаваната честота:

Стъпка 2: Получава се стойността на e^-m. Ако стойността на e^-m не е дадена в формулировката на проблема, тогава —

Стъпка 3: Изчислете вероятността за успех 0, 1, 2, 3 или x с помощта на разпределението на Поасон —

Следователно има две свойства на експеримента на Поасон:

  • Вероятността за възникване е еднаква за всеки два интервала с еднаква дължина.
  • Случването или липсата на който и да е интервал е независимо от възникването или липсата на всеки друг интервал.

Разпределението на Поасон е тясно свързано с уравнението на биномното разпределение, както е посочено в таблицата по-долу:

Наблюдение от таблицата на фигура 8:

В трите колони с вероятности над таблицата записите и стойностите са идентични. Всъщност всяка колона с вероятности предоставя добри приближения на записите във всяка друга колона. Следователно в много случаи разпределението на Поасон може да се използва за приближаване на биномно разпределение.

Изчисление на базата на разпределението на Поасон

Уравнението на разпределението на Поасон отговаря на няколко въпроса. Например по-долу е показано изложение на проблем, базирано на разпределението на Поасон:

Нека броят на случаите на ухапване от змия, наблюдавани в Нигерия за една година, има разпределение на Поасон със средно 6 случая на ухапване.

Каква е вероятността за една година:

  • Броят на случаите на ухапвания от змии ще стане 7?
  • Броят на случаите на ухапване от змия ще бъде по-малък от 2?
  • Каква е вероятността след 2 години да има 10 случая на ухапване?
  • Каква е вероятността след месец да няма случаи на ухапване от змия?

Решение:

Нека X = брой случаи на ухапване от змия за година:

X ~Поасон (6) → (λ = 6)

Въз основа на твърдението, показано на фигура 9:

Броят на случаите на ухапвания от змии ще стане 7?

Поставяне на стойността 7 в уравнението:

Следователно, не. случаи на ухапвания от змии ще бъдат 7 = 0,13768

Броят на случаите на ухапване от змия ще бъде по-малък от 2?

Поставяне на стойност 2 в уравнението —

Следователно, не. случаите на ухапване от змия ще бъдат по-малко от 2 = 0,01735

Каква е вероятността след 2 години да има 10 случая на ухапване?

Нека Y = Брой случаи на ухапване от змия за 2 години

Следователно вероятността след 2 години да има 10 случая на ухапване = 0,1048

Каква е вероятността след месец да няма случаи на ухапване от змия?

Нека W = брой случаи на ухапване от змия за месец.

Следователно вероятността след месец да няма случаи на ухапване от змия = 0,6065

Внедряване на Python

Импортирайте всички необходими пакети:

import math

Метод за изчисляване на факториел:

def factorial(n):
   if n == 0 or n == 1:
     return 1
   else:
     return n * factorial(n-1)

Метод за изчисляване на разпределението на Поасон:

def poisson_distribution(mean,k):
  temp=((mean**k)*(math.e **(-mean)))/factorial(k)   return temp

Изпълнение на метода на разпределението на Поасон:

poisson_dist = poisson_distribution(2,7)
poisson_dist

Биномиално разпределение

Биномиалното разпределение е вероятностното разпределение, при което очакваме няколко успеха в n опита, където P(успех във всяка една следа) = p.

Дава се от

Връзката между Поасон и бином

Разпределението на Поасон се използва за моделиране на редки събития средно при скорост λ за интервал от време. Може да мисли за „рядко“ срещане по отношение на p Æ 0 и n Æ ∞. Вземете тези граници така, че λ = np — моделите на биномно разпределение за n успеха с вероятност p [5].

За да видите по-добре връзката между тези две разпределения, помислете за биномната вероятност да видите x успехи в nn опити, с вероятността за успех, спомената по-горе, pp, както е показано по-долу.

Нека означим очакваната стойност на биномното разпределение, npnp, с λλ. Забележете, това означава, че:

Където q = 1-p

Пренаписвайки P(x)P(x) по отношение на λλ, nn и xx, получаваме

Използвайки стандартната формула за комбинациите от nn неща, взети xx наведнъж

След това имаме точно х-фактори в числителя на първата дроб. Нека разменим знаменателите между първата и втората дроби, разделяйки nx [7].

Разделяне на последния фактор на две части

Накрая стигаме до уравнението.

Поасоново приближение до бинома

Биномиалното и Поасоновото разпределение са дискретни вероятностни разпределения.

Общо взето:

Ако n е голямо (n › 70) и p е малко (да речем ‹ 0,1), тогава Bin(n, p) може да бъде приблизително апроксимирано с Po(λ), където λ = np

Защо да използваме приблизително разпределение, когато знаем точното разпределение?

  • Точното разпределение може да е трудно за работа.
  • Точното разпределение може да има твърде много подробности. Използвайки приблизителното разпределение, ние се фокусираме върху конкретни неща [6].

Постановка на проблема

Отдел за монтаж на телевизор прави анализ на дефектите, за да разбере броя на дефектите за даден дефектен телевизор. От минали данни за качество и одит се вижда, че средно 12 дефекта са отбелязани за дефектен телевизор.

Изчисляване:

  • Вероятността един дефектен лаптоп да има точно 5 дефекта.
  • Вероятността един дефектен лаптоп да има по-малко от 5 дефекта.

Решение

Импортирайте всички важни необходими пакети:

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

Вземете всички числа:

n = np.arange(0,30)n

По време на одита са отбелязани средно 12 дефекта, следователно:

скорост = 12

rate = 12poisson = stats.poisson.pmf(n,rate)poisson

Отрови:

Вероятност:

poisson[5]

poisson[0] + poisson[1] + poisson[2] + poisson[3] + poisson[4]

График на вероятността:

plt.plot(n,poisson, 'o-')plt.show()

Графично представяне

Следното показва графично представяне на разпределението на Поасон:

Присвояване на a = 10

Изчисляване на вероятността за n пристигане int time:

Диаграма на разпределението на Поасон със средна стойност = 5

Заключение

В реални приложения разпределенията на Поасон се използват предимно за определяне на вероятността дали дадено събитие може да се случи или не, разбирайки колко често обикновено се случва, предсказване колко пъти може да се случи събитие в даден интервал от време, заедно с други приложения [ 8].

Например, застрахователна компания използва разпределение на Поасон, за да извърши анализ на риска, за да предвиди броя на автомобилните катастрофи и произшествията в рамките на предварително определен период от време). Въз основа на това изчисление компанията определя цената на автомобилната застраховка — разпределението решава кой модел се брои, като например броя на закупените полици, броя на предявените искове и т.н.).

Не е подходящо да се третира като непрекъсната променлива при такива обстоятелства и да се прилага, т.е. линейна регресия. Следователно възприемането на обобщен подход за моделиране и определянето на разпределението като Поасон е дискретно разпределение.

Това е непрекъснат еквивалент на експоненциалното разпределение, което моделира интервала между всеки две събития. Едно събитие може да бъде измерено само като настъпило или ненастъпило. Тоест, променливата може да бъде измерена само в цели числа. Дробните повторения на събитието не са част от модела [9].

Този процес е в основата на теорията за опашката [10] — опашката е събитие, което се случва, подреждайки се в линия или опашка. Например, въпреки че капацитетът на повечето сървъри е достатъчен, за да обслужва голям брой хора през работния ден, разпределението на Поасон може да помогне за прогнозиране и предотвратяване на дълги опашки в определени часове на деня.

ОТКАЗ ОТ ОТГОВОРНОСТ: Възгледите, изразени в тази статия, са на автора(ите) и не представляват възгледите на никоя компания (пряко или непряко), свързана с автора(ите). Тази работа не възнамерява да бъде краен продукт, а по-скоро отражение на текущото мислене, заедно с това да бъде катализатор за дискусии и подобрения.

Всички изображения са от автора(ите), освен ако не е посочено друго.

Публикувано чрез Към AI

Ресурси

Хранилище на Github.

Внедряване на Google Colab.

Препратки

[1] „Поасонови и биномни разпределения“. 2021., Дейвид С. Хауъл, Uvm.Edu. https://www.uvm.edu/~statdhtx/StatPages/More_Stuff/PoissonBinomial/PoissonBinom.html.

[2] Лекции за процеса на Поасон, Гюнтер Ласт и Матю Пенроуз, KIT — Изследователският университет в Асоциацията Хелмхолц, https://www.math.kit.edu/stoch/~last/seite/lectures_on_the_poisson_process/media/lastpenrose2017 .pdf

[3] PennState Eberly College of Science, Въведение в теорията на вероятностите, https://online.stat.psu.edu/stat414/lesson/12/12.1

[4] Лекция 4: Случайни променливи и разпределения, Джошуа Кий, Университет на Вашингтон, https://www.gs.washington.edu/academics/courses/akey/56008/lecture/lecture4.pdf

[5] Връзка между биномно и поасоново разпределение, Драган Беневич, STA 257, Университет на Торонто, https://www.coursehero.com/file/p4ctrla/P-%E2%84%A6-1-For-where- A-i-са-несвързани-Това-свойство-се нарича-изброима-аддитивност/

[6] Разпределението на Поасон, Сара Филипи, Департамент по статистика, Оксфордски университет, http://www.stats.ox.ac.uk/~filippi/Teaching/psychology_humanscience_2015/lecture5.pdf

[7] Поасонови приближения, Дейвид Полард, Йейлски университет, http://www.stat.yale.edu/~pollard/Courses/241.fall97/Poisson.pdf

[8] За шанса и непредсказуемостта: лекции за връзките между математическата вероятност и реалния свят., Дейвид Олдъс, 2021 г. Stat.Berkeley.Edu. https://www.stat.berkeley.edu/~aldous/Real-World/book_april_2015.pdf.

[9] “ Poisson.Docx — Ако е дадена средна или средна вероятност за случване на събитие за единица време\/на страница\/на циклична миля и т.н. и вие сте помолени да изчислите | Герой на курса “. 2021. Coursehero.Com. https://www.coursehero.com/file/78018138/poissondocx/.

[10] „Моделиране на производителността и проектиране на компютърни системи: Теория на опашките в действие“. 2021. Cs.Cmu.Edu. https://www.cs.cmu.edu/~harchol/PerformanceModeling/book.html.

[11] Разпределение на Поасон, Уикипедия, https://en.wikipedia.org/wiki/Разпределение на Поасон