Въведение в машинното обучение с линейна регресия и приличен градиент, част 2

Продължавайки от предишния урок, спряхме да научим как да прогнозираме цените от графика, използвайки параметрите m и c, ако не сте го проверили, вземете предишния урок, така че преминавайки към по-трудни неща, които очевидно 🙄 се надяваме да обърнем това в система, така че определено искаме да можем да направим това без да чертаем графика, така че трябва да изберем стойност на m и c, където общата грешка ще бъде най-ниска или ако е възможно 0, така че нека изведем нашата грешка или Функция на разходите

логично нашата грешка трябва да бъде разликата между нашата реална стойност (y) и прогнозираната стойност (y’), която е

j = y - y’

но нека направим това по-точно, като повдигнем резултата на квадрат

j=(y - y’)²

така че това е нашата грешка

така че за предпочитане искам да използвам средната грешка от всички наши стойности, така че нека кажем сумата от всяка грешка, разделена на числото, така че да получим

E(y - y’)² / N за всички набори от данни

И нашето y’ = mx + c

ние получаваме тяхната, така че знаем нашата функция на разходите, ние не знаем само коя стойност ще направи стойността си най-ниска, можем да използваме произволни стойности, докато стигнем до нея, но няма да знаем дали това е нашата най-ниска възможна стойност, така че нека направим нещо друго, начертайте го на графика и поставете j(функция на разходите) на оста d y и нашия градиент на нашата ос x и нека считаме c за 0 и имаме

y’ = mx + 0

така че нека изберем набор от произволни стойности за нашата m променлива, забележете, че ще поставя правилната стойност, която прави функцията на разходите най-ниска

m = [-3,-2,-1,0,1,2,3]

нашите данни

x= [1,2,3]

y =[1,2,3]

решавайки всичко, ще получите графика като тази, забележете, че точката, в която j е най-ниска, е когато m е 0

Нашата ос y е j, а оста x е m

Това означава, че m=0 ще ни даде възможно най-малката грешка в нашите изчисления

Но това е, когато го разгледаме в две измерения, какво ще стане, ако искаме да добавим параметъра C, ще получим триизмерна графика като

сега започваме да разбираме това, най-накрая можем да преминем към следващата част от този дълъг урок, който е приличен градиент според вида на диаграмата по-горе, сигурен съм, че схващаме идеята за това, така че ще се видим в следващия урок