Кодиране на етикета| Машинно обучение | Инженеринг на характеристиките

Какво е кодиране на етикети?

Кодирането на етикети се отнася до преобразуването на колоните в числови стойности. Имайки предвид, че в набор от данни има много повече колони, но за да разберем, ще се съсредоточим само върху една колона. Например: тук посочете в категорична колона, за да разберем алгоритъма за машинно обучение, ще направим кодиране на етикети, за да го преобразуваме в числова стойност.

Така че за неговото прилагане всичко, което трябва да направим е:

Импортирайте класа LabelEncoder от библиотеката sklearn
Поставете и трансформирайте първата колона от данните
Замяна на съществуващите текстови данни с новите кодирани данни.

Какво е горещо кодиране?

Кодирането е действие на конвертиране. Едно горещо кодиране преобразува категоричен набор от данни в числови данни чрез разделяне на една колона на множество колони.

Енкодерът на етикети се използва, когато:

Броят на категориите е доста голям, тъй като еднократното кодиране може да доведе до висока консумация на памет.
Когато редът няма значение в категориалния признак.

Един горещ енкодер се използва, когато:

Когато редът няма значение в категориалните характеристики
Категориите в една функция са по-малко.

Разлика между кодиране на етикети и горещо кодиране?

Кодиране на етикети Еднократно кодиране1. Категориалните стойности се етикетират в числови стойности чрез присвояване на всяка категория на номер1. Колона с категорични стойности се разделя на няколко колони.2. Не се добавят различни колони. По-скоро различни категории се преобразуват в числови стойности. Така че по-малко изчисления.2. Ще добави повече колони и ще бъде тежко изчислително3. Има уникална информация3. Има излишна информация4. За представяне на данни се използват различни цели числа4. Само 0 и 1 се използват за представяне на данни

Кодиране на етикета| Машинно обучение | Инженеринг на характеристиките

Енкодерът на етикети се използва, когато:

Един горещ енкодер се използва, когато:

Подобни въпроси