Публикации по теме 'feature-engineering'


Навигация по проблемам и методам разработки категориальных признаков
«Улучшение представления переменных для машинного обучения» Категорические переменные , также известные как качественные переменные, представляют собой переменные, представляющие отдельные категории или группы, а не числовые значения. Эти переменные часто содержат метки или текстовые данные и играют решающую роль во многих областях, включая социальные науки, маркетинг и машинное обучение. Категориальные переменные создают уникальные проблемы по сравнению с числовыми переменными, в..

Выбор переменной с использованием информационного значения (IV)
Вес доказательства (WOE) и информационная ценность (IV) — это простые, но мощные методы для выполнения преобразования и выбора переменных . Вес доказательств Формула для расчета веса свидетельства для любого признака дается выражением Масса доказательств говорит о предсказательной силе одного признака. Как интерпретировать приведенную выше формулу Если какая-либо из категорий/ячеек функции имеет большую долю событий по сравнению с долей несобытий, мы получим высокое..

Что такое факторный анализ в машинном обучении
Факторный анализ в машинном обучении: Сократите большое количество переменных до меньшего количества факторов. 2. Включает максимальную общую дисперсию в общую оценку. 3. Связывает несколько наблюдаемых переменных со скрытой переменной. 4. Имеет одинаковое количество факторов и переменных, при этом каждый фактор содержит определенную величину общей дисперсии. Собственное значение : мера дисперсии, которую фактор объясняет для наблюдаемых переменных. Фактор с собственным..

Полиномиальные признаки Склерна ~ Разработка признаков
Лучший способ автоматизировать и повысить точность нашей модели машинного обучения Привет, как дела? Я надеюсь, что это хорошо. Я наткнулся на интересную тему, Разработка функций с использованием нашего любимого пакета sklearn. Sklearn предоставляет мощный пакет для создания новых функций, где новые функции представляют собой комбинации взаимодействий. И с целью таких преобразований увеличить количество входных признаков приводит к лучшему пониманию и точности модели. Если вы..

Разработка функций в ML с примером кода Python
Инжиниринг признаков — это процесс использования знаний предметной области о данных для создания признаков, которые заставляют работать алгоритмы машинного обучения. Этот процесс увеличивает предсказательную силу алгоритмов машинного обучения за счет создания функций из необработанных данных, которые помогают облегчить процесс машинного обучения. Вот несколько распространенных методов проектирования функций: Биннинг или группировка: значения группируются в корзины. Биннинг может помочь..

Использование временного затухания в прогнозной оценке потенциальных клиентов
Введение Оценка потенциальных клиентов является важным аспектом любого процесса продаж или маркетинга. Это позволяет компаниям выявлять потенциальных клиентов, которые с наибольшей вероятностью приобретут их товары или услуги. В этой статье я объясню, как вы можете использовать затухание времени для улучшения ваших моделей машинного обучения для оценки потенциальных клиентов. Используя временное затухание, вы можете придать большее значение недавней активности пользователя и сделать свои..

Цикл разработки машинного обучения
Вероятно, не подтверждено общее количество циклов разработки. Но, согласно моим исследованиям, я нашел несколько циклов 9. Они :- Сформулируйте проблему Сбор данных Предварительная обработка данных Исследовательский анализ данных (EDA) Особенности проектирования и выбора Обучение модели, оценка и выбор Развертывание модели Тестирование Оптимизация. Теперь мы будем знать каждый из них один за другим. 1. Сформулируйте проблему:- Выбор метода машинного обучения для..