Простая линейная регрессия — это статистический метод, используемый для установления взаимосвязи между двумя переменными, где одна является независимой, а другая — зависимой переменной. Этот метод называется «линейным», потому что он предполагает, что связь между переменными представляет собой прямую линию. В этом блоге мы объясним, как выполнить простую линейную регрессию с помощью кода Python.
Допустим, у нас есть набор данных с двумя переменными: X и Y. Мы хотим использовать простую линейную регрессию, чтобы понять, как X влияет на Y. Мы будем использовать библиотеку Python Scikit-learn для выполнения этого анализа. Вот как это сделать:
Сначала импортируем необходимые библиотеки:
import numpy as np from sklearn.linear_model import LinearRegression
Далее мы создаем наш набор данных. В этом примере мы будем использовать образец набора данных из Scikit-learn:
from sklearn.datasets import make_regression X, y = make_regression(n_samples=100, n_features=1, noise=10)
Здесь мы создаем набор данных со 100 образцами, 1 функцией и уровнем шума 10. X — независимая переменная, а y — зависимая переменная.
Теперь мы создаем объект LinearRegression и подгоняем его под наши данные:
reg = LinearRegression().fit(X, y)
Это создаст модель линейной регрессии и подгонит ее под наши данные.
Теперь мы можем использовать модель для прогнозирования. Допустим, мы хотим предсказать значение y для нового значения X. Мы можем использовать метод predict():
new_X = np.array([[0.5]]) predicted_y = reg.predict(new_X)
Здесь мы прогнозируем значение y для нового значения X = 0,5.
Мы также можем построить данные и линию регрессии, чтобы визуализировать взаимосвязь между X и Y:
import matplotlib.pyplot as plt plt.scatter(X, y) plt.plot(X, reg.predict(X), color='red') plt.show()
Это создаст точечную диаграмму данных и линию регрессии.
Вот и все! Теперь мы выполнили простую линейную регрессию, используя код Python. Этот метод полезен во многих областях, включая финансы, маркетинг и экономику. Понимая взаимосвязь между двумя переменными, мы можем принимать более правильные решения и прогнозы.