Публикации по теме 'outlier-detection'


Удаление выбросов с использованием Z-оценки для модели линейной регрессии
В статистике выброс — это точка данных, которая значительно отличается от других наблюдений. Выброс может быть связан с изменчивостью измерения или может указывать на экспериментальную ошибку; последние иногда исключаются из набора данных . Выброс может вызвать серьезные проблемы в статистическом анализе. Ниже приведена методика обнаружения выбросов и способы их удаления с помощью Z-Score. Код написан на Python, а в качестве IDE используется Google Colab. Необходимые библиотеки:..

Фактор локального выброса (LOF) для обнаружения аномалий
LOF для обнаружения новизны и аномалий Local Outlier Factor (LOF) — это неконтролируемая модель для обнаружения выбросов. Он сравнивает локальную плотность каждой точки данных с ее соседями и идентифицирует точки данных с более низкой плотностью как аномалии или выбросы. В этом уроке мы поговорим о В чем разница между обнаружением новизны и обнаружением выбросов? Когда использовать обнаружение новизны и обнаружение выбросов? Как использовать фактор локального выброса (LOF) для..

5 методов обнаружения выбросов, которые должен знать каждый «энтузиаст данных»
Методы обнаружения выбросов (визуальные эффекты и код) Выбросы - это те наблюдения, которые сильно отличаются (разные свойства) от других точек данных в выборке генеральной совокупности. В этом блоге мы рассмотрим 5 методов обнаружения выбросов, которые должен знать каждый энтузиаст данных . Но перед этим давайте посмотрим и разберемся с источником выбросов. Каковы возможные источники выбросов в наборе данных? Существует несколько причин, по которым в наборе данных..

Обнаружение выбросов в машинном обучении
Что такое выбросы? Выбросы — это точки данных, которые значительно отличаются от остальных точек данных в наборе данных. Выбросы увеличивают дисперсию в наборе данных, что, в свою очередь, приводит к снижению статистической мощности. Поэтому очень важно идентифицировать эти выбросы и относиться к ним соответствующим образом. Причины возникновения выбросов Выбросы могут возникать по разным причинам. Некоторые из наиболее распространенных причин включают в себя: Ошибка ввода..

Обнаружение экстремальных событий данных
Автоматическое обнаружение и анализ экстремальных явлений в реальных данных Анализируя данные, мы часто думаем о метриках высокого уровня — сколько прибыли мы получили вчера? Сколько пользователей запросили эту конечную точку API? Сколько раз был куплен этот товар? Но иногда эти высокоуровневые показатели могут сильно искажаться из-за экстремальных событий. Например, ошибка в обработке кода скидки может позволить покупателю оформить заказ с корзиной на 10 долларов. Это может..

Методологии профилактического обслуживания (прогнозирования аварийных сигналов) в области телекоммуникаций - 1
Реализация профилактического обслуживания в области телекоммуникационной сети намного сложнее по сравнению с другими доменами, поскольку существует множество подсистем, которые взаимодействуют друг с другом в фоновом режиме, и причина сбоя может быть связана с любой из них. Кроме того, у вас будут разные типы и форматы источников данных, что усложняет предварительную обработку данных. Честно говоря, наиболее привлекательной частью всех этих процессов является превращение разных исходных..