Свързани публикации 'feature-engineering'


Опростено: Техники за категорично кодиране на данни
Съдържание: ∘ Съдържание ∘ Как работи поредното кодиране? ∘ пример ∘ Едно горещо кодиране ∘ Прихващане на фиктивни променливи ∘ OHE, използвайки най-честите променливи Има два типа данни Числовите данни се състоят от количествена информация, изразена или измерена с помощта на числа. Тя може да бъде категоризирана като дискретна (отделни стойности) или непрекъсната (стойности в непрекъсната скала, например: възраст, тегло и височина). Категоричните данни се..

Подобрете своя модел на машинно обучение с инженеринг на функции
През повечето време необработените данни са лош вход, те съдържат ценна информация, но са скрити от проектирането на добри модели за машинно обучение, докато не бъдат обработени във форма, по-удобна за използване, това е мястото, където силата на инженерството на функции влиза в игра. Инженерингът на функциите е от основно значение за направата на моделите за машинно обучение да правят точни прогнози, но също така отнема много време задача, ние обикновено посвещаваме всяка част от нашето..

Анализ на пазарната кошница на Instacart: Част 2
Инженеринг и анализ на характеристиките Решаване на предизвикателството за анализ на пазарната кошница на Instacart с машинно обучение за подобряване на изживяването на клиента при пазаруване. Както видяхте в последния ми блог, обсъдихме изложението на проблема и също така направихме задълбочено EDA на данните, предоставени от Instacart. Ако не сте виждали последния ми блог, вижте го тук . Това е част 2 от поредицата от три части на моя блог за анализ на пазарната кошница..

Кодиране на числени характеристики| Дискретизация| Бинаризация
Въведение Както подсказва името, ще говорим за числени функции. Ако не сте много наясно с това, тогава може би си мислите, че защо кодираме числови характеристики е, защото предоставяме числени характеристики на алгоритми за машинно обучение, но тук ние го кодираме. Има случаи, в които кодирането на числови характеристики помага за подобряване на производителността на алгоритмите за машинно обучение. Ако е малко объркващо за вас, прочетете цялата статия. Ще разгледаме темите с..

Пълно ръководство за машинно обучение с проекти в Python | EDA към алгоритми
Въведение Полето на машинното обучение се разширява бързо и има потенциала напълно да промени начина, по който подхождаме към решаването на проблеми в различни индустрии. Въпреки това, предвид количеството достъпен материал по темата, може да е предизвикателство да знаете откъде да започнете или как да отидете, за да придобиете познания в тази област. За да разгледаме всички тези теми, включително проучвателен анализ на данни (EDA), инженерство на функции, статистическо моделиране и..

Типовете функции са типове данни на разширен език за програмиране в ML
TL;DR Програмистите познават типовете данни. Типът данни за променлива в език за програмиране дефинира набора от валидни операции върху тази променлива - невалидните операции ще причинят грешка, или по време на компилиране, или по време на изпълнение. Но какво е тип функция за програмист, който е нов в машинното обучение, като се има предвид, че нито един масов език за програмиране няма естествена поддръжка за тях? В тази публикация ние дефинираме тип функция и обсъждаме какво означава тип..

Инженеринг на функции за задълбочено обучение
Инженерингът на функции и извличането на функции са ключови — и отнемащи време — части от работния процес на машинно обучение. Те са за трансформиране на данни за обучение и разширяването им с допълнителни функции, за да направят алгоритмите за машинно обучение по-ефективни. Дълбокото обучение променя това, според неговите промоутъри. При задълбочено обучение човек може да започне със сурови данни, тъй като характеристиките ще бъдат автоматично създадени от невронната мрежа, когато се..