За да се извърши статистически анализ на данните, е важно да се разберат различните нива на изследване, които съществуват.

За да се извърши статистически анализ на данните, е важно да се разберат различните нива на изследване, които съществуват. За да направи това, Габриел Мендоса, професор по онлайн курса Статистически основи за анализ на данни, обяснява с кратък пример какъв тип информация може да бъде получена на всяко от тези нива:

1. Проучвателната

2. Описателната

3. Релационните

4. Обяснителната

5. Предсказуеми

6. Приложението

Това е прост начин за посочване на нивата на статистическото изследване. По-късно обаче ще видим по-задълбочено как се класифицират видовете статистически анализи и как всеки от тях се различава.

Видове статистически анализ

Има различни начини за извършване на статистически анализ, но за това е важно да знаете какъв тип анализ искате да извършите въз основа на целите на изследването.

В рамките на класификацията на статистическия анализ можем да разграничим 2 вида, които зависят от следното:

В зависимост от неговата цел или функция.

В зависимост от броя на променливите.

Видове статистически анализи според функции

Както споменахме по-рано, статистическият анализ служи за множество цели и е отговорен за предоставянето на необходимите данни, така че да можете да вземете правилните решения въз основа на доказателствата.

В този смисъл, ако направим проучване на видовете статистически анализи според целта на организацията, имаме следните категории.

1. Проучвателната

Проучвателен анализ на данни се отнася до събирането на статистически данни с цел разбиране на основните основи на данните, за откриване на отклонения или изключителни стойности.

До каква информация ще можете да получите достъп чрез този тип статистически анализ в реалния живот? Чрез това проучване можете да определите:

В кой бранш се продава повече.

Разлики между най- и най-малко продаваните продукти.

Какъв продукт има на склад?

…и дълго и т.н. Можем да кажем, че това е основен инструмент за анализ на статистически данни, тъй като ви позволява да получите ситуационен преглед на текущото състояние на вашия бизнес.

Извършването на статистически анализ на данни в първата фаза на изследването е много полезно, за да се избегне събирането на ненужна, грешна или неочаквана информация. Именно чрез това статистическо изследване ще можете да формулирате хипотеза, която по-късно ще трябва да проверите или отхвърлите. с инференциален анализ.

2. Изводен

С инференциалния анализ на данните няма да имаме абсолютна сигурност, тъй като той се основава на заключения с относителна вероятност. Целта на този вид изследване е да могат да се правят бъдещи прогнози и сравнения въз основа на това как са се развили изследваните данни.

За да не ви объркваме с толкова много теория, ето един пример за инференциален анализ:

Има хипотеза, че продукт X се купува от големи семейства. Следователно тези групи са потенциални кандидати за придобиване на други подобни или допълващи се продукти.

Продажбата на водещ продукт кара клиентите да консумират други подобни продукти в по-малки количества.

Когато извършвате изводен анализ, трябва да имате предвид, че не можете да използвате същите данни, които сте събрали в проучвателния анализ, за ​​да формулирате хипотезата, тъй като това би съществува пристрастие и може да обезсили заключенията.

3. Описателната

Описателните статистически анализи са най-често срещаните и, както подсказва името му, се използват за описание на набор от данни и по този начин да се знае информацията в детайли и начина, по който е структурирана.

И в какви ситуации могат да се извършват тези анализи? Ще го видим по-долу с някои примери за описателен анализ в една компания:

Ако искате да знаете броя на извършените продажби.

Нов брой клиенти.

Брой артикули на склад.

По същество описателният статистически анализ е ограничен до правене на изводи от събраните данни. Няма повече завои за даване.

4. Предсказуеми

По принцип ппредсказуемият статистически анализ идентифицира връзките между различните променливи на минали събития, изследва тези връзки и поддържа прогноза за резултата. за бъдещи събития.

За да разберем по-добре този тип проучване, нека видим някои примери за прогнозен анализ, прилаган в бизнес средата: — Определете количеството наличност, което трябва да се съхранява в склада за всеки артикул в магазина.

Прогнозирайте вида услуга, която трябва да бъде поискана от съвета през следващите години, въз основа на данни от регистъра.

За разлика от инференциалния статистически анализ, който се стреми да разбере и докаже връзката, прогнозният статистически анализ е наясно със стойността и какво означава това за бъдещето, без да се интересува прекалено от връзката между компонентите.

5.Небрежни

Чували ли сте някога за причина и следствие? С причинно-следствения статистически анализ можете да свържете как определени действия в крайна сметка засягат някои променливи, както и да определите на какво ниво са засегнати.

За да го разберем по-добре, нека направим сравнение с инференциален анализ:

С инференциалния статистически анализ ние определяме, че когато водещият продукт се продава, останалите продукти правят в по-малко количество, но не знаем дали продажбата на по-малко от този продукт ще увеличи продажбите на останалите.

Тоест с инференциален анализ виждаме връзката. От друга страна, причинно-следственият статистически анализ се стреми да се задълбочи малко в данните и да намери причината за споменатия ефект, който се генерира между променливите.

За какво се използва причинно-следственият анализ? Позволява ви ефективно да разследвате и решавате някои проблеми, които могат да засегнат една или повече услуги.

6. Механизъма

И накрая, стигаме до механистичния статистически анализ, който може да бъде малко по-сложен за разбиране и затова ви препоръчваме да обърнете максимално внимание.

Благодарение на този статистически анализ можем да разберем и предвидим как променливите си влияят една на друга (не на резултата). По същия начин ни позволява да знаем как промяната в една от променливите може да повлияе на резултата от всички тях като цяло.

Механичният статистически анализ е едно от най-рядко използваните изследвания на данни, тъй като човек трябва да владее добре процесите, които ще се изследват. Можем да го видим в случаи като следните:

В рамките на една компания увеличаването на инвестициите в реклама, както и увеличаването на персонала на маркетинговия отдел оказва влияние върху увеличаването на броя на продажбите. Чрез механистичен статистически анализ ще бъде възможно да се проучи как последните влияят на предишните променливи.

Видове статистически анализ според броя на променливите

Променлива е всяка характеристика или свойство, качествено или количествено, което е част от явление, което трябва да се изследва. В този смисъл, в зависимост от броя на променливите, които трябва да бъдат разгледани, можем да намерим три много добре дефинирани типа статистически анализ:

1. Едномерен анализа

Това е първичен, основен статистически анализ, така да се каже, тъй като измерва функция по характеристика в изолация.

Сега пример за прост едномерен статистически анализ:

Човек тежи X килограма.

Това означава, че при разработването на едномерен статистически анализ всички процеси и компоненти на средна стойност, медиана, режим, проценти... измерват една променлива.

Едномерният анализ е много противоречив, тъй като променливите обикновено са взаимосвързани и, за да се направят заключения, се разглежда връзката между две или повече променливи. Нека да разгледаме тази ситуация:

Ако човек тежи X на брой килограми и измерва X на брой метри, този човек е тежък.

В този случай се обръщаме към втория тип статистически анализ, за ​​да разберем по-добре как тези асоциации започват да се установяват.

2. Двумерен анализа

По същество двумерният статистически анализ е извършването на статистическа обработка на 2 променливи едновременно.

Нека да видим пример за двумерен статистически анализ с този случай:

Ако говорим за X брой омъжени жени, ние вземаме предвид две променливи: женски пол и семейно положение.

Въпреки че е малко по-широк, двумерният статистически анализ все още е лесен за разбиране. Въпреки това, в случай, че е необходимо да се изследват повече променливи, ще трябва да се съсредоточим върху последния тип анализ, който съществува.

3. Многовариантен анализи

Този статистически анализ се характеризира с факта, че се анализират 3 или повече променливи и тяхната съществуваща връзка.

Голямата му полза е, че позволява синтезиране на връзките между анализираните променливи, въпреки че не се използва широко, когато се работи с напреднал статистически анализ.

Вече знаете какви са видовете статистически анализи, които можете да използвате според всяка ситуация и според броя на променливите. Но искате ли да знаете как да направите такъв? Продължете да четете тази бележка, за да разберете стъпките, които трябва да следвате.

Видове статистически анализи според броя на променливите

Как се прави статистически анализ на данни?

Вече видяхме защо. Сега нека да разберем как.

Въпреки че сме виждали много теория досега, това не означава, че извършването на анализ на данни е трудна задача за изпълнение. Трябва само да обърнете внимание на 5-те стъпки за извършване на статистически анализ, които ви показваме по-долу:

1. Компилацията

За да започнете да извършвате статистически анализ, е важно да имате база данни за променливата(ите), която искате да изследвате. Как се получава тази информация? Чрез проучвания, големи данни, социални мрежи, бизнес разузнаване или други средства. Всичко става в статистическия анализ.

2. Обработка на данните

Следващата стъпка за извършване на статистически анализ е да се обработи цялата събрана информация за по-нататъшен анализ. Тази фаза включва:

Почистване на данни.

Филтриране на информация.

Хомогенизиране на данни.

3. Представяне на данните

Няма много мистерия, става дума за процеса на представяне на данните за статистически анализ. Обикновено се използват таблици, стълбовидни, линейни или кръгови графики, за да могат да обяснят по по-ефективен начин как са свързани променливите и развитието на данните.

4. Анализ на данните

Тук процесът влиза като такъв. Вече имаме променливите, сега трябва да видим за какво служат. В тази фаза можем да направим нашите общи заключения, базирани на статистическия анализ на извадковите данни.

5. Тълкуване на данните

След като представим и анализираме данните, следващата стъпка е да интерпретираме статистическите данни.

В зависимост от интерпретацията, която даваме на тази информация, ще можем да открием тенденция или модел, както и да опишем бъдещи сценарии. За това е този статистически анализ.

Вече знаете какво да направите, за да извършите статистически анализ. Сега, бихте ли искали да знаете какви инструменти имате на ваше разположение?

Инструменти за статистически анализ

За щастие, извършването на статистически анализ става все по-проста задача, тъй като има различни програми, които улесняват обработката на всички тези данни. Например, ние ви даваме няколко опции:

SAS

Платформата за статистически анализ SAS ви дава възможност да използвате графичния потребителски интерфейс (GUI) или да генерирате скриптове в случай на по-напреднали изследвания.

Много е полезно, особено ако искате да извършите сложен статистически анализ и да създадете графики. Все пак кодирането може да бъде проблем, ако не сте запознати с него. Това е истинско бижу! Идеален за проекти от всякакъв размер и сложност.

R.

Освен това е безплатен софтуерен пакет за статистически анализи, както за изследване на човешкото поведение, така и за други области.

В този случай плъгините са налични за множество приложения, което би било предимство при различни форми на обработка на данни.

SPSS (IBM)

Ако искате да изучавате човешкото поведение, вероятно няма да намерите по-добър софтуер за анализ на статистически данни от SPSS.

Тази програма ви дава възможност да компилирате описателни статистики, както и параметрични и непараметрични анализи или графични представяния.

MATLAB

Освен аналитична платформа, MatLab е и език за програмиране, често използван от учени или инженери.

Ако имате нужда от статистически анализ на данни или създаване на модели, този инструмент ще си заслужава. Въпреки това, трябва да имате предвид, че манипулирането може да бъде малко сложно.

MS Excel

Програмата на Microsoft, която обичате, ако знаете как да я използвате, или я мразите, ако никога не сте се научили да я използвате правилно.

Въпреки че не е най-добрият вариант за този вид статистически анализ, Excel разполага с различни инструменти, които ще ви позволят да визуализирате данните и да прегледате проста статистика.

Ако искате да видите основните концепции на вашите данни, тази програма ще бъде повече от достатъчна за вас.

Тук е краят.

Нека продължим да учим заедно!