Распределения вероятностей — одна из самых интересных тем, с которыми вы столкнетесь при изучении статистики. Этот инструмент нашел большое значение в экономике, финансах, машинном обучении, науке о данных и т. Д. Эта статья будет довольно нематематическим введением в распределения вероятностей.

Прежде чем я начну обсуждение вероятностных распределений, я хочу дать очень краткое представление о случайных переменных, которые очень важны для этой темы. Начнем с простого примера. Предположим, у меня есть эта случайная величина, которую я называю «X», и она хранит количество орлов, которые я получаю, если я подбрасываю две монеты одновременно. Как вы думаете, какие значения может принимать моя случайная величина X? Ну, а если подбросить две монеты одновременно, то может либо не выпасть решка, либо одна решка, либо две решки. Итак, моя случайная величина X может принимать значения 0,1 и 2.

Случайная переменная, как следует из названия, представляет собой переменную, которая количественно определяет результат некоторого события, которое является случайным или неопределенным по своей природе. (Прочитайте это еще раз)

Случайными переменными могут быть рост или вес учеников в классе, количество воды, которую вы выпиваете каждый день, количество автомобилей, пересекающих улицу за определенный период времени, количество посетителей веб-сайта в определенный день и т. д.

Случайные величины бывают двух типов: дискретные и непрерывные. Дискретные случайные величины — это те, которые принимают различные значения.

Если случайная величина может принимать только конечное число различных значений, то она должна быть дискретной.

Примеры дискретных случайных величин включают количество пациентов, посещающих поликлинику, количество посетителей веб-сайта в день, количество автомобилей, пересекающих улицу в заданный период времени, и т. д.

С другой стороны, непрерывная случайная величина,, принимает бесконечное число возможных значений. Непрерывные случайные величины обычно являются измерениями.

Примеры непрерывных случайных величин включают вес или рост учащихся в классе, количество воды, которую вы выпиваете каждый день, и т. д. Вес человека является непрерывной переменной, поскольку находится в диапазоне, скажем, от 60 до 65 кг. он может принимать любое значение. Это не обязательно должно быть 61 кг или 64 кг. Это может быть 61,5678 кг, 61,9856 кг, 60,4590 кг или что-то еще. (Остановитесь на мгновение и посмотрите, уловили ли вы разницу между дискретной переменной и непрерывной переменной).

Давайте теперь посмотрим, что такое распределения вероятностей.

Подумайте о распределении вероятностей так: в распределении вероятностей вы просто распределяете вероятности по различным значениям, которые может принимать случайная величина. Распределения вероятностей бывают двух типов: Дискретное распределение вероятностей и Непрерывное распределение вероятностей.

Дискретное распределение вероятностей

Давайте рассмотрим очень простой случай. Предположим, мы бросаем 6-гранную игральную кость и пусть X будет нашей случайной величиной, которая принимает значения, которые мы получаем после каждого броска. Таким образом, X может принимать значения 1,2,3,4,5,6. Обратите внимание, что это дискретная случайная величина. Пусть f(X) обозначает вероятность того, что X = x [x = 1,2,3,4,5,6]. При этом вероятность получения любого значения от 1 до 6 одинакова, т.е. 1/6. Итак, распределение вероятностей:

Мы можем изобразить это на графике

Это было дискретное распределение вероятностей, поскольку у нас была дискретная случайная величина. Мы можем математически выразить это распределение вероятностей в виде функции. Затем она будет называться функция массы вероятности.

Функция массы вероятности для нашего примера с игральными костями может быть записана как

f(x) = {1/6, для 1≤x≤6, 0 в противном случае

Давайте рассмотрим еще один пример дискретного распределения вероятностей.

Предположим, мы бросаем две кости одновременно. Случайная величина Y представляет собой сумму чисел, выпавших на двух игральных костях. f(Y) обозначает вероятность значений, которые может принимать Y. Мы хотим построить для этого распределение вероятностей. Сначала нам нужно знать, какие значения может принимать Y. Ниже приведены возможные результаты, которые мы можем получить в этом эксперименте:

Распределение вероятностей возможных значений случайной величины Y:

Нанеся это распределение вероятностей на график, получим:

Непрерывное распределение вероятностей

Предположим, что случайная величина Z — это веса студентов колледжа, в котором обучается 1800 студентов. Распределение вероятностей для Z может выглядеть примерно так:

Вы спросите, почему это должно выглядеть именно так? Причина довольно проста. Людей с избыточным или недостаточным весом очень мало. Подумайте об этом так: если вы пойдете на прогулку по кампусу этого колледжа и заметите массу тела студента, вероятность того, что вы увидите людей с весом от 40 до 80, намного выше, чем вероятность того, что вы увидите людей с весом меньше 30 и более 90 (прочитайте еще раз). Другими словами, вы с большей вероятностью увидите людей с нормальным весом, чем с экстремальным весом. Это называется нормальным распределением.

Я надеюсь, что эта статья поможет вам понять основную идею и интуицию, лежащую в основе распределения вероятностей. Продолжай учиться!