Какво е кодиране на етикети?
Кодирането на етикети се отнася до преобразуването на колоните в числови стойности. Имайки предвид, че в набор от данни има много повече колони, но за да разберем, ще се съсредоточим само върху една колона. Например: тук посочете в категорична колона, за да разберем алгоритъма за машинно обучение, ще направим кодиране на етикети, за да го преобразуваме в числова стойност.
Така че за неговото прилагане всичко, което трябва да направим е:
- Импортирайте класа LabelEncoder от библиотеката sklearn
- Поставете и трансформирайте първата колона от данните
- Замяна на съществуващите текстови данни с новите кодирани данни.
Какво е горещо кодиране?
Кодирането е действие на конвертиране. Едно горещо кодиране преобразува категоричен набор от данни в числови данни чрез разделяне на една колона на множество колони.
Енкодерът на етикети се използва, когато:
- Броят на категориите е доста голям, тъй като еднократното кодиране може да доведе до висока консумация на памет.
- Когато редът няма значение в категориалния признак.
Един горещ енкодер се използва, когато:
- Когато редът няма значение в категориалните характеристики
- Категориите в една функция са по-малко.
Разлика между кодиране на етикети и горещо кодиране?
Кодиране на етикети Еднократно кодиране1. Категориалните стойности се етикетират в числови стойности чрез присвояване на всяка категория на номер1. Колона с категорични стойности се разделя на няколко колони.2. Не се добавят различни колони. По-скоро различни категории се преобразуват в числови стойности. Така че по-малко изчисления.2. Ще добави повече колони и ще бъде тежко изчислително3. Има уникална информация3. Има излишна информация4. За представяне на данни се използват различни цели числа4. Само 0 и 1 се използват за представяне на данни