Публикации по теме 'statistical-analysis'


Линейная регрессия: математическая интуиция
С самого начала своего пути специалиста по данным вы привыкли к этому алгоритму машинного обучения. Линейная регрессия, поскольку это основной и главный алгоритм машинного обучения, с которого мы обычно начинаем анализировать различные проблемы регрессии. Как говорит слово linear, линейная связь между входными переменными (x) и зависимой выходной переменной (y). В основном анализ линейной регрессии выполняет задачу прогнозирования выходной переменной путем моделирования или поиска..

Уровни изучения статистики для анализа данных
Для проведения статистического анализа данных важно понимать существующие уровни изучения. Для проведения статистического анализа данных важно понимать существующие уровни изучения. Для этого Габриэль Мендоса, профессор онлайн-курса «Статистические основы анализа данных», на кратком примере объясняет, какой тип информации можно получить на каждом из этих уровней: 1. Исследовательский 2. Описательный 3. Относительный 4. Пояснение 5. Предиктивный 6...

Основы кривой RoC и показателя AUC
Основы кривой RoC и показателя AUC Кривая RoC обозначает кривую рабочих характеристик приемника, а AUC обозначает площадь под кривой. Чтобы полностью понять кривую RoC и показатель AUC, нам необходимо понять матрицу неточностей. Матрица неточностей - это матрица размером 2X2 между Фактическим +/- и Тестовым +/-. Тем не менее, мы можем переключаться между True и Test. Когда Фактический + и - имеют одинаковые значения в Тесте, это называется Истинно Положительным и Истинно Отрицательным..

Матрица корреляции: -
Введение: Что такое корреляционная матрица? Матрица корреляции — это матрица, которая показывает корреляцию между переменными. Он дает корреляцию между всеми возможными парами значений в матричном формате. Мы можем использовать корреляционную матрицу, чтобы обобщить большой набор данных, выявить закономерности и принять решение в соответствии с ними. Мы также можем увидеть, какая переменная больше коррелирует с какой переменной, и мы можем визуализировать наши..

Методы выборки по важности и уменьшения дисперсии
Методы, основанные на выборке, широко распространены в информатике, статистике, машинном обучении, исследовании операций и других областях. Однако прямая выборка из желаемого распределения вероятностей не всегда может быть осуществимой или эффективной из-за ее высокой дисперсии, что приводит к неточным оценкам. Для решения этой проблемы были разработаны выборка по важности и другие методы уменьшения дисперсии. Выборка по важности Выборка по важности — это метод, используемый при..

ANOVA — Краткий обзор и его реализации.
Anova или ANAlysis Of VAriance позволяет нам выйти за рамки сравнения только двух популяций. С помощью Anova мы можем сравнивать несколько популяций, а также их подгруппы. Используя Anova, мы можем проверить, значительно ли отличаются друг от друга средние значения двух или более групп. Почему Anova? На этом этапе мы сравнивали две совокупности независимых выборок (случайный t-критерий) и t-критерий парных выборок. Мы ограничились сравнением двух популяций и более. Если есть..

Понимание линейной регрессии и ее использование в прогнозировании непрерывных переменных.
Линейная регрессия — это метод статистического моделирования, используемый для обнаружения взаимосвязи между зависимой переменной и независимой переменной. Он простой, но мощный и является одним из наиболее часто используемых алгоритмов в машинном обучении. В финансах он используется для прогнозирования цен на акции и процентных ставок, в здравоохранении он используется для прогнозирования результатов лечения пациентов на основе различных факторов, в последнее время для анализа влияния..