Публикации по теме 'hypothesis-testing'


Ваша модель лучшая или самая удачливая?
Как не попасться на удочку случайности при выборе лучшей модели Мы привыкли видеть проблемы с наукой о данных в Kaggle, где разница в 0,1% в балле ROC может иметь значение между выигрышем 100 000 долларов или ничего. Возьмем, к примеру, вызов Data Science Bowl 2017 . Призы составили 500 000 долларов за 1 место, 200 000 за 2 место, 100 000 за 3 место и так далее. В качестве показателя для оценки была выбрана логарифмическая потеря. Это была финальная таблица лидеров: Теперь,..

Понимание и решение вопросов гипотезы с легкостью
Проверка гипотез является частью логической статистики, где мы работаем с выборкой и популяцией. Гипотеза — это просто утверждение или утверждение о параметре совокупности, таком как среднее значение совокупности, пропорция дисперсии и т. д. Обычно мы исследуем утверждение, не заходя в лабораторию, как мы делаем в другом эксперименте, а что мы делаем, так это выбираем образец из совокупности и получаем данные, и, изучая выборку, изучаем совокупность. Короче говоря, давайте разберемся в..

Что такое ошибки первого и второго рода?
Давайте сначала разберемся с NULL(H0) и ALTERNATE(HA) гипотезой: Здесь предположение должно быть сделано для населения, а не для выборки. Сначала мы предполагаем, что нулевая гипотеза верна . На основании результатов статистических тестов либо мы « отвергаем нулевую гипотезу» , либо нам « не удалось отклонить нулевую гипотезу» . Ошибка типа I: отклонение нулевой гипотезы, когда она верна . Ошибка типа II: не отвергать нулевую гипотезу, если она ложна . Здесь..

Изучение P-значения в статистике и машинном обучении
В области машинного обучения понимание и использование p-значения является важной частью прогнозирования успеха или неудачи данного алгоритма. Понимание этого статистического измерения может помочь вам стать более опытным в своих моделях машинного обучения и интерпретировать данные, которые они производят. В этом сообщении блога мы более подробно рассмотрим, что такое p-значение, и обсудим, как лучше всего использовать его в ваших проектах машинного обучения. Что такое P-значение?..

A / B-тестирование: подход Python (часть 1)
Эта статья предназначена для людей, которые хотят узнать, как реализовать A / B-тестирование. Если вы хотите получить обзор A / B-тестирования, ознакомьтесь, пожалуйста, с другой моей статьей . Обзор Набор данных Cookie Cats взят из испытания Kaggle. Это мобильная игра-головоломка, в которой необходимо соединить плитки одного цвета, чтобы очистить доску и выиграть уровень. После пересечения различных уровней появляются ворота, которые обычно служат для показа пользователям рекламы..

Проверка гипотез с помощью Python
В своей предыдущей статье я говорил о статистических проверках гипотез. Они имеют решающее значение в статистике и науке о данных, поскольку нас всегда просят обобщить огромное количество данных, которые мы хотим проанализировать, на выборках. После получения выборок, которые можно упорядочить с помощью различных методов, таких как выборка начальной загрузки , общая цель состоит в том, чтобы сделать выводы о реальных параметрах, принадлежащих исходным популяциям, путем вычисления так..