Статистиката е изкуството да се правят числени предположения относно озадачаващи въпроси. […] Методите са разработени в продължение на няколкостотин години от хора, които са търсили отговори на своите въпроси.— Страница xiii, Статистика, четвърто издание, 2007 г.

Всички специалисти по AI са загрижени за разбирането на алгоритмите от теоретична гледна точка, но дълбоко в себе си математиката и статистиката са тези, които дебнат и играят важна роля. Нека разберем това в детайли.

нека започнем с „Как можем да дефинираме статистиката“?

както казва Уикипедия,

статистиката е в основата на усъвършенстваните алгоритми за машинно обучение, улавяйки и превеждайки модели на данни в приложими доказателства.

Наука за данни

Науката за данни винаги се занимава с данни, но начинът за вземане на решения се крие в статистиката. След събирането на данни е важно да знаете неговите разпределения, крайните стойности, централните тенденции и много други неща. Тук статистиката ви помага. Познаването на статистиката ви позволява да изберете най-добрите техники за събиране на данни, да приложите правилния анализ и ефективно да съобщите констатациите. Правенето на преценки въз основа на данни, правенето на прогнози и правенето на научни открития зависи от статистиката. Можете да получите много по-задълбочено разбиране на дадена тема, благодарение на статистиката.

Данни

Данните играят важна роля в днешния технологичен свят. Всички технологии се управляват от данни и генерират големи количества данни всеки ден. Учените по данни са експерти в анализирането на източниците на данни, почистването и обработката на данни, разбирането защо и как са генерирани такива данни, получаването на прозрения от данните и извършването на благоприятни за бизнеса промени. Последните данни са всичко.

Тъй като данните нарастват екстензивно, ще бъде трудно да се справят с тях с обикновени и традиционни техники.Статистиката е способна и винаги ще може да се справя с цялата предварителна и последваща обработка на данни. Както гласи легендата, ученът по данни трябва да бъде добър разказвач на истории или на детето си, или на клиента. Можете да очаквате помощ от статистика тук. Вероятностната функция разказва за разпределенията, разпределенията разказват за това как да се работи с данните и накрая данните разказват за изходите.

Няколко теми, които смятам, че ще помогнат за работата с данни, са следните.

Описване и показване на данни

Графични дисплеи
Числени обобщения
Нормални разпределения
Категорични данни

Линейна регресия и корелация

Линейна регресия
Корелация
Извод при линейна регресия
Множествена линейна регресия
ANOVA за регресия

Експерименти и вземане на проби

Експериментален дизайн
Вземане на проби
Вземане на проби в статистически извод

Вероятност

Вероятностни модели
Условна вероятност
Случайни променливи
Средна стойност и дисперсия на случайни променливи
Примерни средни стойности

Тестове на хипотези и доверителни интервали

Интервали на доверителност
Тестове за значимост
Сравнение на две средни стойности
Извод за категорични данни
Хи-квадрат тест за добро съответствие
Двупосочни таблици и хи -Квадратен тест

Има много статистически концепции, които трябва да знаете, вместо да споменавам. Продължавайки тази серия, в следващите блогове ще пиша повече за статистиката от основите до напредналите. Можете да ме последвате за такива интересни блогове и серии за статистика.

можете да се свържете с мен в LinkedIn.