Проблемите с машинното обучение могат най-общо да бъдат категоризирани в два широки типа:
Регресия: Когато трябва да намерим проста функционална връзка между входните характеристики/променливи. Тази функционална връзка може да бъде някаква математическа функция, т.е. полиномна функция. За напр. даденият набор от данни включва функцията Температури и етикет Потребление на енергия. Задачата на ML е намирането на връзката между тези характеристики, за да се предскаже потреблението на мощност, когато температурата е дадена. Това е пример за проста линейна регресия.
Класификация: Когато трябва да категоризираме дадените проби в някои класове или групи. За напр. даденият набор от данни включва всички видове животни с техните физически характеристики и етикети (влечуги, морски и т.н.) и задачата на ML е да категоризира тези животни според етикета и да предвиди етикета на ново животно с дадени физически характеристики.
Някои бележки
m:брой тренировъчни проби
x: входна променлива (функция)
y:изходна променлива (етикет/цел)
(x(i), y(i)): i-та обучителна извадка/наблюдение
Опростена линейна регресия
От името на темата може да се предвиди, че линейната функция ще се използва за определяне на връзката между характеристика и етикет за решаване на регресионен проблем.
Следните стъпки могат да се използват за прилагане на проста линейна регресия:
Данни за обучение: Даденият набор от данни може да бъде разделен на набор за обучение, тест и набор за валидиране. Обикновено 80% от данните се считат за обучителен набор, а останалите 20% са тестов набор.
Изследване на данни и извличане на функции: Ще подготвя отделен урок за изследване на данни, защото повече от 60% задача в проекта за машинно обучение е изследване на данни. Извличането на характеристики също е част от изследването на данни и това е основно какви функции/входящи данни ще се използват за модел, например при прогнозиране на времето, температура, влажност, поток на вятъра и т.н. данните се дават, така че какви функции трябва да бъдат включени за прогнозиране.
Модел на машинно обучение: Избира се подходящият модел на машинно обучение, който може да бъде внедрен за решаване на проблема.
Показател за качество:yе действителният резултат и ŷ е предвидената стойност. За измерване на качеството може да се изчисли различна матрица като средна квадратна грешка.
Пример:
Както е показано на горната снимка, броят на редовете може да се напасне чрез данни, но тогава кой ред пасва най-добре?
Отговорът на този въпрос е функцията на разходите. Функцията на разходите тук е остатъчната сума на квадрат (RSS), където остатъкът е разстоянието между прогнозираната стойност и действителната продукция.
Защо RSS, защо не абсолютната сума на грешките или остатъците?
За да отговорим подробно на този въпрос, трябва да обсъдим градиентната функция, която ще обсъдим в следващия урок. Отговорът на този въпрос всъщност е, че функцията RSS е изпъкнала, затова сме сигурни, че ще има една минимална точка, която може лесно да се изчисли с помощта на градиентно спускане. Обещавам, че този отговор ще ви бъде ясен, след като говоря за градиентно спускане.
Горната фигура дава ясно описание как изглежда най-подходящата линия и представяне на грешките. Уравнението се дава от:
Тук θ0 е y-пресечната точка, а θ1 е наклонът. RSS се дава като:
Референции:
- Някои от изображенията и данните са взети от слайдовете на моя курс по машинно обучение, преподаван в Western University.
- Заглавна връзка към изображението: https://unsplash.com/photos/UdneLq-Qm10