Простая линейная регрессия с кодом Python

Простая линейная регрессия — это статистический метод, используемый для установления взаимосвязи между двумя переменными, где одна является независимой, а другая — зависимой переменной. Этот метод называется «линейным», потому что он предполагает, что связь между переменными представляет собой прямую линию. В этом блоге мы объясним, как выполнить простую линейную регрессию с помощью кода Python.

Допустим, у нас есть набор данных с двумя переменными: X и Y. Мы хотим использовать простую линейную регрессию, чтобы понять, как X влияет на Y. Мы будем использовать библиотеку Python Scikit-learn для выполнения этого анализа. Вот как это сделать:

Сначала импортируем необходимые библиотеки:

import numpy as np
from sklearn.linear_model import LinearRegression

Далее мы создаем наш набор данных. В этом примере мы будем использовать образец набора данных из Scikit-learn:

from sklearn.datasets import make_regression
X, y = make_regression(n_samples=100, n_features=1, noise=10)

Здесь мы создаем набор данных со 100 образцами, 1 функцией и уровнем шума 10. X — независимая переменная, а y — зависимая переменная.

Теперь мы создаем объект LinearRegression и подгоняем его под наши данные:

reg = LinearRegression().fit(X, y)

Это создаст модель линейной регрессии и подгонит ее под наши данные.

Теперь мы можем использовать модель для прогнозирования. Допустим, мы хотим предсказать значение y для нового значения X. Мы можем использовать метод predict():

new_X = np.array([[0.5]])
predicted_y = reg.predict(new_X)

Здесь мы прогнозируем значение y для нового значения X = 0,5.

Мы также можем построить данные и линию регрессии, чтобы визуализировать взаимосвязь между X и Y:

import matplotlib.pyplot as plt
plt.scatter(X, y)
plt.plot(X, reg.predict(X), color='red')
plt.show()

Это создаст точечную диаграмму данных и линию регрессии.

Вот и все! Теперь мы выполнили простую линейную регрессию, используя код Python. Этот метод полезен во многих областях, включая финансы, маркетинг и экономику. Понимая взаимосвязь между двумя переменными, мы можем принимать более правильные решения и прогнозы.

Простая линейная регрессия с кодом Python

Похожие вопросы