Свързани публикации 'feature-engineering'


Навигиране в предизвикателствата и техниките в инженеринга на категорични характеристики
„Подобряване на представянията на променливи за машинно обучение“ Категоричните променливи , известни също като качествени променливи, са променливи, които представляват отделни категории или групи, а не числени стойности. Тези променливи често съдържат етикети или текстови данни и играят решаваща роля в много области, включително социални науки, маркетинг и машинно обучение. Категориалните променливи поставят уникални предизвикателства в сравнение с числените променливи, главно..

Избор на променлива с помощта на информационна стойност (IV)
Тежестта на доказателствата (WOE) и информационната стойност (IV) са прости, но мощни техники за извършване на трансформация и селекция на променливи . Тежест на доказателствата Формулата за изчисляване на тежестта на доказателствата за всяка характеристика е дадена от Тежестта на доказателствата показва предсказващата сила на една характеристика Как да тълкуваме горната формула Ако някоя от категориите/кошовете на функция има голям дял събития в сравнение с дела..

Какво е факторен анализ в машинното обучение
Факторен анализ в машинното обучение: Редуцирайте голям брой променливи в по-малък брой фактори. 2. Поставя максимална обща дисперсия в общ резултат. 3. Асоциира множество наблюдавани променливи с латентна променлива. 4. Има еднакъв брой фактори и променливи, като всеки фактор съдържа определено количество обща дисперсия. Собствена стойност : Мярка за дисперсията, която даден фактор обяснява за наблюдаваните променливи. Фактор със собствена стойност ‹ 1 обяснява по-малко..

Sklearn PolynomialFeatures ~Инженеринг на функции
Най-добрият начин за автоматизиране n подобряване на точността на нашия модел за машинно обучение Здравейте, как стоят нещата? надявам се да е добре. Попаднах на интересна тема, Инженеринг на функции с помощта на нашия любим пакет sklearn. Sklearn предоставя мощен пакет за създаване на нови функции, където новите функции са комбинации от взаимодействия. И с цел такива трансформации за увеличаване на броя на входните характеристики води до по-добро разбиране и точност на модела...

Инженеринг на функции в ML с примерен код на python
Инженерингът на функции е процесът на използване на знанията за домейна на данните за създаване на функции, които карат алгоритмите за машинно обучение да работят. Този процес увеличава предсказващата сила на алгоритмите за машинно обучение чрез създаване на функции от необработени данни, които помагат за улесняване на процеса на машинно обучение. Ето няколко общи инженерни техники за функции: Групиране или групиране: Стойностите се групират заедно в контейнери. Групирането може да..

Използване на затихване във времето при прогнозиране на резултата
Въведение Оценяването на потенциални клиенти е критичен аспект на всеки процес на продажба или маркетинг. Той позволява на бизнеса да идентифицира потенциални клиенти, които е най-вероятно да закупят техните продукти или услуги. В тази статия ще обясня как можете да използвате затихване във времето, за да подобрите вашите модели за машинно обучение за точкуване на потенциални клиенти. Като използвате затихване във времето, можете да придадете по-голямо значение на скорошната..

Цикъл на развитие на машинното обучение
Вероятно не е потвърден общият брой на цикъла на развитие. Но според моите проучвания открих донякъде 9 цикъл. Те са:- Поставете проблема в рамка Събиране на данни Предварителна обработка на данни Проучвателен анализ на данни (EDA) Характеристики Инженеринг и селекция Обучение, оценка и подбор на модели Внедряване на модела Тестване Оптимизиране. Сега ще разберем всеки от тях един по един. 1. Поставете проблема в рамка:- Изборът на метод за машинно обучение за..