Свързани публикации 'statistics'


Какво е PCA ?
Анализът на главните компоненти (PCA) е да се намери подмножеството от променливи, което най-добре обяснява вариацията в данните. Да видим какво точно означава това, Често се случва да има толкова много функции в набора от данни и малка част от информацията присъства във всяка характеристика или променлива. Например, да предположим, че имаме набор от данни, който се състои от 50 колони (характеристики), ще бъде почти невъзможно да визуализираме тези 50 характеристики в един и същи график..

Измерване на променливост и разпространение — Диапазон, IQR, дисперсия, стандартно отклонение
Променливостта и разпространението са важни понятия в статистиката, които помагат да се опише количеството на вариация или дисперсия в набор от данни. Тези мерки предоставят информация за разпределението на данните, която може да се използва, за да се направят изводи за популацията, от която са взети данните. В този блог ще обсъдим четири мерки за променливост и разпространение: диапазон, интерквартилен диапазон, дисперсия и стандартно отклонение. Ще предоставим и примери, за да..

Мярка за асиметрия
Изкривяване: По принцип изкривяването показва къде са концентрирани данните в нашите набори от данни. Той измерва асиметрия или изкривяване на симетрично разпределение. Също така, той измерва отклонението на даденото разпределение на случайна променлива от симетричното разпределение. Като нормално разпределение. Изкривяването би било много по-лесно за нас, ако имаме ясно разбиране за средната стойност, медианата и модата. Има три типа изкривяване, изкривяване надясно,..

Моделиране с ARIMA
Моделиране с ARIMA Раздел 4: Моделиране с ARIMA В този раздел ще се задълбочим в процеса на моделиране с помощта на модела ARIMA (Авторегресивна интегрирана подвижна средна). ARIMA е метод за прогнозиране на времеви редове, който съчетава авторегресивни (AR) и подвижни средни (MA) компоненти, което го прави подходящ за прогнозиране на зависими от времето данни като обменни курсове. Преглед на модела ARIMA: AutoRegressive (AR): Този компонент моделира връзката между текущата..

Пълно ръководство за машинно обучение с проекти в Python | EDA към алгоритми
Въведение Полето на машинното обучение се разширява бързо и има потенциала напълно да промени начина, по който подхождаме към решаването на проблеми в различни индустрии. Въпреки това, предвид количеството достъпен материал по темата, може да е предизвикателство да знаете откъде да започнете или как да отидете, за да придобиете познания в тази област. За да разгледаме всички тези теми, включително проучвателен анализ на данни (EDA), инженерство на функции, статистическо моделиране и..

Ден 04 — Корелация и ковариация, 7 дни статистика за науката за данни
Добре дошли в четвъртия ден от нашата серия за статистика за науката за данни. В тази статия ще изследваме концепциите за корелация и ковариация, две основни мерки за това как променливите са свързани. Те могат да ни помогнат да разберем връзката между функции и целеви променливи или между различни характеристики в набор от данни. Те предоставят значителна информация, която може да помогне да се подготвят данни за анализ и да се изберат правилни алгоритми за машинно обучение, като..

ANOVA — Кратък преглед и неговите реализации
Anova или ANalysis Of VAriance ни позволява да преминем отвъд сравняването само на две популации. С Anova можем да сравняваме множество популации, а също и техните подгрупи. С помощта на Anova можем да проверим дали средните стойности на две или повече групи се различават значително една от друга. Защо Anova? В този момент сравнявахме две популации от независими проби (случаен t-тест) и t-тест за сдвоени проби. Бяхме се ограничили да сравняваме две популации и повече. В случай, че..