Проблемите с машинното обучение могат най-общо да бъдат категоризирани в два широки типа:

Регресия: Когато трябва да намерим проста функционална връзка между входните характеристики/променливи. Тази функционална връзка може да бъде някаква математическа функция, т.е. полиномна функция. За напр. даденият набор от данни включва функцията Температури и етикет Потребление на енергия. Задачата на ML е намирането на връзката между тези характеристики, за да се предскаже потреблението на мощност, когато температурата е дадена. Това е пример за проста линейна регресия.

Класификация: Когато трябва да категоризираме дадените проби в някои класове или групи. За напр. даденият набор от данни включва всички видове животни с техните физически характеристики и етикети (влечуги, морски и т.н.) и задачата на ML е да категоризира тези животни според етикета и да предвиди етикета на ново животно с дадени физически характеристики.

Някои бележки

m:брой тренировъчни проби

x: входна променлива (функция)

y:изходна променлива (етикет/цел)

(x(i), y(i)): i-та обучителна извадка/наблюдение

Опростена линейна регресия

От името на темата може да се предвиди, че линейната функция ще се използва за определяне на връзката между характеристика и етикет за решаване на регресионен проблем.

Следните стъпки могат да се използват за прилагане на проста линейна регресия:

Данни за обучение: Даденият набор от данни може да бъде разделен на набор за обучение, тест и набор за валидиране. Обикновено 80% от данните се считат за обучителен набор, а останалите 20% са тестов набор.

Изследване на данни и извличане на функции: Ще подготвя отделен урок за изследване на данни, защото повече от 60% задача в проекта за машинно обучение е изследване на данни. Извличането на характеристики също е част от изследването на данни и това е основно какви функции/входящи данни ще се използват за модел, например при прогнозиране на времето, температура, влажност, поток на вятъра и т.н. данните се дават, така че какви функции трябва да бъдат включени за прогнозиране.

Модел на машинно обучение: Избира се подходящият модел на машинно обучение, който може да бъде внедрен за решаване на проблема.

Показател за качество:yе действителният резултат и ŷ е предвидената стойност. За измерване на качеството може да се изчисли различна матрица като средна квадратна грешка.

Пример:

Както е показано на горната снимка, броят на редовете може да се напасне чрез данни, но тогава кой ред пасва най-добре?

Отговорът на този въпрос е функцията на разходите. Функцията на разходите тук е остатъчната сума на квадрат (RSS), където остатъкът е разстоянието между прогнозираната стойност и действителната продукция.

Защо RSS, защо не абсолютната сума на грешките или остатъците?

За да отговорим подробно на този въпрос, трябва да обсъдим градиентната функция, която ще обсъдим в следващия урок. Отговорът на този въпрос всъщност е, че функцията RSS е изпъкнала, затова сме сигурни, че ще има една минимална точка, която може лесно да се изчисли с помощта на градиентно спускане. Обещавам, че този отговор ще ви бъде ясен, след като говоря за градиентно спускане.

Горната фигура дава ясно описание как изглежда най-подходящата линия и представяне на грешките. Уравнението се дава от:

Тук θ0 е y-пресечната точка, а θ1 е наклонът. RSS се дава като:

Референции:

  1. Някои от изображенията и данните са взети от слайдовете на моя курс по машинно обучение, преподаван в Western University.
  2. Заглавна връзка към изображението: https://unsplash.com/photos/UdneLq-Qm10