Публикации по тематике feature-engineering

Публикации по теме 'feature-engineering'

Упрощенно: Категориальные методы кодирования данных

Оглавление: ∘ Оглавление ∘ Как работает порядковое кодирование? ∘ пример ∘ Одно горячее кодирование ∘ Ловушка фиктивной переменной ∘ OHE с использованием наиболее часто встречающихся переменных Есть два типа данных Числовые данные состоят из количественной информации, выраженной или измеренной с помощью чисел. Его можно разделить на дискретные (различные значения) или непрерывные (значения на непрерывной шкале, например: возраст, вес и рост). Категориальные..

Улучшите свою модель машинного обучения с помощью проектирования функций

В большинстве случаев необработанные данные - плохой ввод, они содержат ценную информацию, но они скрыты от разработки хороших моделей машинного обучения до тех пор, пока они не будут преобразованы в форму, более удобную для использования, вот где в игру вступает сила разработки функций. Разработка функций имеет фундаментальное значение для того, чтобы модели машинного обучения делали точные прогнозы, но также это трудоемкая задача, мы обычно посвящаем каждую часть нашего времени и..

Анализ потребительской корзины Instacart: часть 2

Разработка функций и анализ Решение задачи анализа потребительской корзины Instacart с помощью машинного обучения для улучшения покупательского опыта. Как вы видели в моем последнем блоге, мы обсудили постановку задачи, а также провели углубленную EDA данных, предоставленных Instacart. Если вы не видели мой последний блог, пожалуйста, обратитесь к нему здесь . Это вторая часть из трех частей моего блога об анализе потребительской корзины Instacart. Другие части этой серии..

Кодирование числовых признаков| Дискретизация| Бинаризация

Введение Как следует из названия, мы будем говорить о числовых функциях. Если вы мало что знаете об этом, вы можете подумать, что мы кодируем числовые признаки, потому что мы предоставляем числовые признаки алгоритмам машинного обучения, но здесь мы кодируем их. В некоторых случаях, когда мы кодируем числовые признаки, это помогает повысить производительность алгоритмов машинного обучения. Если это немного сбивает вас с толку, прочитайте полную статью. Мы будем рассматривать темы..

Полное руководство по машинному обучению с проектами на Python | EDA для алгоритмов

Введение Область машинного обучения быстро расширяется и может полностью изменить наш подход к решению проблем в самых разных отраслях. Однако, учитывая объем доступного материала по этому вопросу, может быть сложно понять, с чего начать или как двигаться, чтобы стать хорошо осведомленным в этой области. Чтобы рассмотреть все эти темы, включая исследовательский анализ данных (EDA), разработку признаков, статистическое моделирование и методы машинного обучения, мы подготовили это..

Типы функций — это расширенные типы данных языка программирования в ML.

TL;DR Программисты знают типы данных. Тип данных для переменной в языке программирования определяет набор допустимых операций с этой переменной — недопустимые операции вызовут ошибку либо во время компиляции, либо во время выполнения. Но что такое тип функции для программиста, плохо знакомого с машинным обучением, учитывая, что ни один из основных языков программирования не имеет встроенной поддержки для них? В этом посте мы определяем тип функции и обсуждаем, что означает тип функции в..

Разработка функций для глубокого обучения

Разработка функций и извлечение функций являются ключевыми и отнимающими много времени частями рабочего процесса машинного обучения. Они касаются преобразования данных обучения и добавления к ним дополнительных функций, чтобы сделать алгоритмы машинного обучения более эффективными. По словам его сторонников, глубокое обучение меняет ситуацию. При глубоком обучении можно начать с необработанных данных, так как функции будут автоматически созданы нейронной сетью при обучении. Например,..