В следващия пример взех под внимание най-високите оценки от JEE, получени от лидера на моя JEE коучинг институт за различни групи магьосници и искам да предскажа най-високия резултат за следващата група, ако същият модел на обучение продължи.

Ако начертая графиките между броя на учениците магьосници и съответния най-висок резултат, почти получавам права крива като тази. Но ако трябва да предскажа най-високия резултат за следващата партида, как да направя това? Как да удължа линията? Тъй като има различни начини, по които мога да удължа възможната права линия, както е показано по-долу. Кое да избера?

И в двата случая можем да намерим MSE и регресионната линия с най-малко MSE е точната, която представя данните, съответстващи на модела.

Споделих екранните снимки на кода за примера, обяснен по-горе.

  • Импортирайте необходимите библиотеки
  • Най-важното е да импортирате linear_model от библиотеката sklearn
  • Прочетете данните от csv файла и го отпечатайте (създадох csv файл с две колони: брой студенти магьосници и най-високи оценки, получени за тази група)

  • Начертайте точковата диаграма за импортираните данни и наблюдавайте модела. Почти виждате права линия, но се отклонява от стандартната права линия

  • Сега трябва да предвидим най-високия резултат за група с 2024 ученици магьосници.
  • Създайте нов набор от данни само с най-високите оценки
  • Създайте линеен регресионен модел с помощта на linear_modelот sklearn
  • Нагласете модела с данните за обучение — рамка с данни на ученика-магьосник и рамка с данни за марки
  • Прогнозирайте оценките за групата студенти-магьосници от 2024 г

  • Както научаваме по-горе, получената права линия е y = mx + c. Следователно, нека се опитаме да намерим отсечката и коефициента и ръчно да изчислим прогнозираната стойност, за да видим дали съвпада с прогнозираната стойност по-горе

Надяваме се това да помогне за разбирането на основната концепция на модела на линейна регресия. В следващия блог ще разгледам логистичната регресия. Моля, споделете вашите отзиви. Това ще ми помогне да прецизирам блоговете си съответно.