Публикации по темата statistics

Свързани публикации 'statistics'

Многовариантно откриване на аномалии

Откриването на аномалии в сложни многовариантни и многомерни данни може да бъде доста предизвикателство. Визуализирането на тези аномалии може да бъде още по-трудно, особено ако искате да бъде просто, без да се налага да преглеждате хиляди диаграми, за да филтрирате проблеми от фалшиви положителни резултати и шум. Използвайки статистически методи, можем да обобщим сложни данни, които да бъдат показани на една топлинна карта. Като задържим курсора на мишката върху определени клетки, можем..

Парадоксът на рождения ден: Рискът от случайно съвпадение със случайни модели във финансовата стратегия...

Ретро тестването на финансовите стратегии е критичен компонент на количествената търговия. Това включва симулиране на стратегия за търговия, като се използват исторически данни за цените, за да се оцени нейното представяне. Значителен риск в този процес е случайното подравняване с случайни модели в данните, често погрешно възприемани като прекомерни. Тази статия има за цел да предостави интуитивно разбиране защо могат да възникнат подобни съвпадения при тестване на стратегията...

Кажете здравей на PyMC 3.5

Публикувано от Chris Fonnesbeck от името на екипа за разработка на PyMC Екипът за разработка на PyMC с гордост обявява пускането на версия 3.5 днес. Тази версия включва няколко подобрения на използваемостта, така че препоръчваме тази актуализация на всички потребители. Прилагането на паралелно вземане на проби е преработено, за да бъде по-стабилно с големи следи, да показва ленти за напредъка за множество вериги и да връща частични резултати за прекъснато вземане на проби. Добавени..

Разбиране на силата и клопките на авторегресивната интегрирана подвижна средна (ARIMA)

Модел при прогнозиране на времеви редове В областта на анализа на времевите редове моделът с авторегресивна интегрирана подвижна средна (ARIMA) е работен кон за правене на прогнози. Това е разширение на модела на авторегресивната подвижна средна (ARMA) и включва идеята за интеграция, за да направи модела приложим към нестационарни данни. Макар и популярен, ARIMA понякога се разбира погрешно. Тази статия има за цел да демистифицира модела ARIMA, да обясни неговите компоненти и да..

Топ 10 въпроса за интервю относно показателите за оценка в машинното обучение

Въведение Показателите за оценка са количествени мерки, използвани за оценка на ефективността на моделите за машинно обучение. Те са важни, защото осигуряват систематичен и обективен начин за сравняване на различни модели и измерване на техния успех при решаването на определен проблем. Чрез сравняване на резултатите от различни модели и оценка на тяхната производителност, специалистите по данни могат да вземат информирани решения за това кои модели да използват, как да подобрят..

Най-добрите статистически книги за машинно обучение

Разгледах 5700 книги само през тази 2021 г. и избрах най-добрите книги, които бяха публикувани, в процес на преглед, публикации с предварителна поръчка, включително книги в процес на работа, както и безплатни електронни книги. Започнах да пиша и рецензии за книгите, за да дам препоръки за читателите. Тези книги бяха прегледани само от мен. Отново, не говоря за екип от редактори от издателска компания във военен режим, който преглежда ...

Неефективно ръководство [3]: k-най-близък съсед в JavaScript

Попитах ChatGPT за втория най-прост алгоритъм за машинно обучение и той ме посъветва k-най-близките съседи. Отново ще поискаме скрипт на Python без никакви фантастични пакети и ще го възпроизведем в JavaScript, за да сме сигурни, че трябва ръчно да кодираме всички подробности. Източници Colab: връзка Runkit: връзка K-най-близки съседи Мисля, че ChatGPT излъга, като каза, че Perceptron е най-лесният модел за машинно обучение, тъй като този изглежда много по-лесен. По същество..