Какво е кодиране на етикети?

Кодирането на етикети се отнася до преобразуването на колоните в числови стойности. Имайки предвид, че в набор от данни има много повече колони, но за да разберем, ще се съсредоточим само върху една колона. Например: тук посочете в категорична колона, за да разберем алгоритъма за машинно обучение, ще направим кодиране на етикети, за да го преобразуваме в числова стойност.

Така че за неговото прилагане всичко, което трябва да направим е:

  • Импортирайте класа LabelEncoder от библиотеката sklearn
  • Поставете и трансформирайте първата колона от данните
  • Замяна на съществуващите текстови данни с новите кодирани данни.

Какво е горещо кодиране?

Кодирането е действие на конвертиране. Едно горещо кодиране преобразува категоричен набор от данни в числови данни чрез разделяне на една колона на множество колони.

Енкодерът на етикети се използва, когато:

  • Броят на категориите е доста голям, тъй като еднократното кодиране може да доведе до висока консумация на памет.
  • Когато редът няма значение в категориалния признак.

Един горещ енкодер се използва, когато:

  • Когато редът няма значение в категориалните характеристики
  • Категориите в една функция са по-малко.

Разлика между кодиране на етикети и горещо кодиране?

Кодиране на етикети Еднократно кодиране1. Категориалните стойности се етикетират в числови стойности чрез присвояване на всяка категория на номер1. Колона с категорични стойности се разделя на няколко колони.2. Не се добавят различни колони. По-скоро различни категории се преобразуват в числови стойности. Така че по-малко изчисления.2. Ще добави повече колони и ще бъде тежко изчислително3. Има уникална информация3. Има излишна информация4. За представяне на данни се използват различни цели числа4. Само 0 и 1 се използват за представяне на данни