Разбирането на данните е основната стъпка за решаване на всеки бизнес проблем. Колкото повече се гмуркате в променливите, дадени в набора от данни, толкова по-добър ставате в намирането на скритите модели, присъстващи в данните. Целта е да се открият връзките между мерките в данните и да се получи представа за тенденциите, моделите и връзките между различните обекти, присъстващи в набора от данни.

Едномерният анализ е най-простата форма за анализ на данни. Състои се от една променлива. Той изследва всяка променлива независимо. Това се прави чрез разглеждане на средна стойност, мода, медиана, стандартно отклонение, дисперсия и т.н. Най-простият пример за едномерен анализ би бил да се анализират заплатите на всички служители във вашата компания.

Видове едномерен анализ

Мерки на централната тенденция

Състои се от средна стойност, медиана и мода. Една единствена стойност се опитва да опише набор от данни, като идентифицира централната позиция в този набор от данни. Нека да разгледаме какво означават всички тези централни тенденции.

Средно

Това е една от най-известните мерки за централна тенденция. Може да се използва както за дискретни, така и за непрекъснати данни. Това е общата сума на всички стойности, разделена на общите стойности в данните.

Медиана

Това е средната стойност на набора от данни. Така че, ако подредите стойностите от данните във възходящ ред и след това откриете средната стойност, това ще бъде медианата. Медианата е по-малко засегната от отклонения и изкривени данни.

Режим

Режимът е най-честият резултат в нашия набор от данни. Обикновено се използва за категорични данни, когато трябва да откриете най-важната категория в набора от данни.

Мерки за дисперсия

В статистиката мерките за дисперсия помагат да се тълкува променливостта на данните, т.е. да се знае колко хомогенни или хетерогенни са данните. С прости думи, показва колко е притисната или разпръсната променливата.

Състои се от

  • Обхват
  • Дисперсия
  • Стандартно отклонение

Диапазон

Това е разликата между максималните и минималните стойности във вашия набор от данни. Да предположим, че имате един служител със заплата 100 и един с 1, тогава диапазонът ще бъде 99.

Разлика

Дисперсията ви казва колко далеч са вашите данни от средната стойност. Изчислява се, като се вземат разликите между всяко число в набора от данни и средната стойност, след това разликите се повдигат на квадрат, за да станат положителни, и накрая сумата от квадратите се разделя на броя на стойностите в набора от данни.

Голямото отклонение показва, че числата в набора са далеч от средната стойност и едно от друго. Малка вариация, от друга страна, показва обратното. Стойност на вариация нула обаче показва, че всички стойности в набор от числа са идентични. Всяка дисперсия, която не е нула, е положително число. Дисперсията не може да бъде отрицателна. Това е така, защото е математически невъзможно, тъй като не можете да имате отрицателна стойност, произтичаща от квадрат.

Стандартно отклонение

Това е просто корен квадратен от дисперсията. Дисперсията и S.D са много сходни концепции, използвани за проверка на променливостта на пазара. Ако дисперсията и sd са ниски, това означава, че инвестицията е по-малко рискова и обратното.

Начини за визуализиране на едномерен анализ

Fтаблици за разпределение на честотата

Стълбовидни диаграми

Хистограми

Кръгови диаграми

Заключение

В този блог говорих за видовете едномерен анализ и начините за тяхното визуализиране. Можете да използвате тези техники въз основа на вашия бизнес проблем и вашите изисквания. Едномерният анализ е първата стъпка при започване на всеки анализ и е една от най-важните. Така че ще ви препоръчам да отделите известно време за това.