Свързани публикации 'statistics'


Грижим ли се достатъчно за пристрастията?
Въведение/Какво е пристрастие? Пристрастие към оцеляването — кратка история Пристрастие на пробата Нетехнически преглед на компромиса Bias-Variance в моделите на машинно обучение Въведение/Какво е пристрастие? Накратко, можем да определим пристрастието като ситуация, в която получената информация не е истинската, а тази, извлечена от определена гледна точка. Проблемът е, че може да накара хората да бъдат насочвани, без да осъзнават, към начин на мислене, до който може би не..

Въведение в случайните блуждания, брауновите движения и свързаните стохастични процеси
В около 15 страници този скреч курс обхваща много повече материал, отколкото се очаква в такава кратка презентация. Това представлява първата глава от предстоящата ми книга „Нежно въведение в хаотичните динамични системи“. Други книги от тази серия са налични тук . Написано на прост английски, но обхващащо теми, вариращи от уводни до напреднали, то е насочено към практици, които се интересуват от бързо, компактно и лесно за четене резюме по темата. Студентите, изучаващи количествени..

Разбиране на корелацията срещу причинно-следствената връзка: Защо едното не винаги предполага другото
В този блог ще разгледаме разликите между корелация и причинно-следствена връзка и защо едното не винаги предполага другото. Въведение Когато две неща са свързани, естествено е да приемем, че едното причинява другото. Въпреки това, само защото две променливи са свързани, не означава, че едната причинява другата. В този блог ще изследваме разликата между корелация и причинно-следствена връзка, като използваме примери от реалния живот, за да илюстрираме защо едното не винаги..

Корелация и причинно-следствена връзка
Корелация и причинно-следствена връзка Ако нашата цел е да намерим статистическа връзка между променливите, трябва да разгледаме тези две концепции. Те са много критични по отношение на разбирането на набора от данни или интерпретирането на резултатите. За съжаление е много лесно да се объркат, защото и двете описват връзката между променливите. Нека се потопим по-дълбоко. Корелация Корелациите между променливите ни показват, че има модел в данните: че променливите, които..

Опит с интервю за наука за данни – Топ 5 зададени въпроса за статистика
Статистиката е една от темите, които стават много плашещи в интервюто за наука за данни. Ако в автобиографията си имате проекти, свързани с регресия, вие със сигурност ще влезете в арената на статистиката. В безброй интервюта въпросите със статистиката станаха причина да не избера. Най-сложното нещо при статистиката е, че нейното прилагане в проекти е присъщо по природа, така че става трудно да се развие ясна интуиция, но все пак, ако можете да покриете 5 основни въпроса/концепции,..

Оценка на максималната вероятност
Част 1: Как да напаснем най-добре гаус Да предположим, както всички правим в петък вечер, вие разглеждате данни за всички ръстове на хората, които посещават университет. Можете да начертаете хистограма на всички данни и тя може да изглежда по следния начин: Чувате, че утре ще пристигне нов човек и искате да разберете каква е вероятността неговият ръст да е в рамките на 5 см от вашия. Как се справяш с това? 1. Познайте формата Първото нещо, което искаме да направим, е да изградим..

Вашият модел най-добрият ли е или най-щастливият?
Как да не бъдете подведени от случайността, когато избирате най-добрия модел Свикнали сме да виждаме предизвикателства в науката за данните в Kaggle, където вариация от 0,1% в ROC резултата може да направи разликата между спечелването на 100 000 $ или нищо. Вземете за пример предизвикателството Data Science Bowl 2017 . Наградите бяха 500 000 $ за 1-во място, 200 000 за 2-ро място, 100 000 за 3-то място и т.н. Избраният показател за оценка беше логаритмична загуба. Това беше..