Публикации по тематике data-mining

Публикации по теме 'data-mining'

Обнаружение выбросов с помощью простых и продвинутых методов

Руководство по обнаружению выбросов с использованием стандартного отклонения, межквартильного диапазона, изолирующего леса, DBSCAN и локального фактора выбросов. Выбросы — это точки данных, которые находятся далеко от большинства наблюдений в наборе данных. Выбросы могут появляться по многим причинам, таким как естественные отклонения в поведении населения, мошеннические действия, человеческие или системные ошибки. Однако обнаружение и идентификация выбросов необходимо перед..

Реализация обучения правилам ассоциации с помощью Python

Анализ рыночной корзины Анализ рыночной корзины является одним из приложений изучения правил ассоциации и применяется в розничной торговле для выявления ассоциаций между различными продуктами. Рыночные корзины состоят из списка товаров, которые покупатели часто покупают за одно посещение магазинов. 2. Изучение правил ассоциации Изучение правил ассоциации — это широко используемый подход к интеллектуальному анализу данных, который помогает найти взаимосвязь между продуктами в..

Введение в выбор экземпляра в интеллектуальном анализе данных

Выбор экземпляра играет важную роль в предварительной обработке данных для машинного обучения. Цель состоит в том, чтобы уменьшить объем данных, используемых для обнаружения знаний. В идеале это приведет к модели с (как минимум) такой же производительностью, как у модели, обученной на всех данных. Большая часть этой записи в блоге, если не указано иное, взята из главы 8 García et al [1]. Цели выбора инстанса Основная цель выбора экземпляра состоит в том, чтобы найти модель..

5 гиперпараметров дерева решений для улучшения ваших алгоритмов дерева

Изучите некоторые из наиболее распространенных гиперпараметров, которые вы можете настроить, чтобы повысить производительность алгоритмов на основе дерева. Деревья решений — это действительно классные алгоритмы, которые создают основу для более продвинутых алгоритмов, таких как Random Forests, LightGBM или XGBoost. Во время вашего путешествия по науке о данных деревья решений, вероятно, являются первым нелинейным алгоритмом, который вы изучите, поскольку они довольно объяснимы и просты..

KI против машинного обучения против глубокого обучения — «В чем разница?

Машинное обучение относится к тенденциям 21 века. Или это было глубокое обучение? Или искусственный интеллект? В чем разница и сходство между ними? Машинное обучение Машинное обучение (ML) — это свод математических методов распознавания образов. Эти методы распознают шаблоны, например, путем разделения данных на иерархические структуры (дерево решений) или использования векторов для определения сходства между наборами данных (например, k-NN или k-Means). Алгоритмы машинного..

Креативность, основанная на данных: как наука о данных вдохновляет на новые идеи

Креативность, основанная на данных, относится к использованию данных и методов анализа данных для вдохновения и информирования творческих идей и принятия решений. В области науки о данных творчество, основанное на данных, можно использовать для выявления закономерностей и тенденций в данных, которые могут привести к новым знаниям и идеям. Например, специалист по данным, работающий в области маркетинга, может использовать анализ данных для выявления закономерностей в поведении клиентов,..

Введение в методы интеллектуального анализа данных и машинного обучения

1. Цель В этом блоге мы будем изучать, что такое интеллектуальный анализ данных. Кроме того, вы изучите область интеллектуального анализа данных, основу, методы интеллектуального анализа данных и терминологию в области интеллектуального анализа данных. По мере изучения этого мы изучим архитектуру интеллектуального анализа данных со схемой. Далее, будет изучать открытие знаний. Наряду с этим мы также изучим приложения для интеллектуального анализа данных, а также их плюсы и минусы...