Какъв е проблемът с класификацията? Как работи логистичната регресия? | Приложен DS #2

В този урок ще обсъдим популярния алгоритъм за контролирано обучение —логистична регресия.

Какво ще научите:

  1. Какво представлява проблемът с класификацията в машинното обучение?
  2. Логистична регресия и нейният работен процес

1. Какво представлява проблемът с класификацията?

Представете си, че имаме пациент, който има следните записи:

  • концентрация на глюкоза: 197
  • Кръвно налягане: 70
  • Дебелина на кожата: 45
  • ИТМ: 30,5
  • Възраст: 45

Нашата целе въз основа на тази информация да диагностицираме дали пациентът има диабет или не. Този вид проблем се нарича класификация в машинното обучение.

Въпросът е следният — Как ще го диагностицираме? За да отговорим на този въпрос, имаме нужда от досиета на предишни пациенти и етикета дали са имали диабет или не. Този вид набор от данни се нарича маркиран набор от данни.

По този начин се нуждаем от набора от данни, за да създадем всякакви модели за машинно обучение. След като имаме обучен ML модел, можем лесно да направим прогноза.

всеки запис, като например глюкоза, кръвно налягане и т.н., се нарича характеристики, който има собствена тежест. Но ние не знаем стойностите на тези тегла, как да го намерим? — Тук идват алгоритмите за машинно обучение.

2. Логистична регресия и нейния работен процес

Логистичната регресия е един от популярните алгоритми за машинно обучение, който предвижда двоични категории (има диабет или не, високо или ниско и т.н.)

Нашите целие да намерим тегла (w1, w2...)на характеристиките и пристрастност (w0). За да направим това, ние ги намираме по итеративен начин. Логистичната регресия има следния работен процес:

Стъпка 1: инициализираме теглата на характеристиките на случаен принцип

Първоначално всички тегла на характеристиките и отклоненията се присвояват на случаен принцип.

Стъпка 2: изчисляваме резултата от хипотезата

Функцията на хипотезата на логистичната регресия е следната:

където Тегласа w1,w2…wn, Отклонениее w0 и Стойности на характеристикиса X1,X2…Xn.

Изходътна тази хипотезна функция варира от 0 до 1.

Тъй като изходът се променя от 0 на 1, той дава възможност на алгоритъма да изпълнява задачи за двоична класификация. Например, ако резултатът от функцията на хипотезата е 0,8, това означава, че е по-вероятно лицето да има диабет.

Стъпка 3: изчисляваме общата загуба въз основа на тези тегла

Общата стойност на загубата е сумата от стойностите на разходите за всеки отделен пациент, разделена на общия брой пациенти.

където h(x) е резултатът от функцията на хипотезата, наричана още предсказаниеи y е реалната стойност, наричана също основна истина. Функцията на разходите е -log(h(x)), когато y=1 (основната истина е равна на 1) и -log(1-h(x)), когато y=0 (основната истина е равна на 0)

Стъпка 4: ние актуализираме теглата с помощта на стохастичен градиентен спад (SGD) или други оптимизатори.

Докато изчисляваме първата обща стойност на загубата, след това актуализираме тегла въз основа на SGD или други оптимизатори. Интуицията зад тези алгоритми е, че те актуализират теглата, като обръщат внимание на това как функцията на загуба се променя по отношение на малки промени в теглото.

повтаряме стъпки 2–4, докато функцията за загуба достигне локалния минимум или бъде достигната максималната итерация.

Можете да видите пълен пример за логистична регресия с повече подробности във видеото.

Следващ урок:

Практически пример за логистична регресия в python.

Ако харесвате моите статии или видеоклипове, ще бъда по-мотивиран, ако ме подкрепите:

  1. Можете да споделите моя канал в YouTube — AI Academy with Friendsс вашите приятели


2. Можете да споделите моята публикация AI Academy with Friends с вашите приятели.



3. Ако искате да се регистрирате в среда, за да получите достъп до неограничен брой истории, можете да използвате моята препоръчана връзка(ще получа малка комисионна без допълнителни разходи за вас)