Это мой первый опыт работы с машинным обучением. У меня есть задание запустить логистическую и байесовскую регрессию от Sklearn на доходности акций яблок и сравнить это с линейной регрессией + тензорный поток. Я не уверен, правильно ли я понимаю, что перед запуском логистической регрессии я должен обучить свой набор данных. Я пытался сделать так, чтобы мои данные выглядели так:
Closing_Price Daily_Returns Daily_Returns_1 Daily_Returns_2 Daily_Returns_3 Daily_Returns_4 Daily_Returns_5
Date
1980-12-22 0.53 0.058269 0.040822 0.042560 0.021979 -0.085158 -0.040005
1980-12-23 0.55 0.037041 0.058269 0.040822 0.042560 0.021979 -0.085158
1980-12-24 0.58 0.053110 0.037041 0.058269 0.040822 0.042560 0.021979
1980-12-26 0.63 0.082692 0.053110 0.037041 0.058269 0.040822 0.042560
1980-12-29 0.64 0.015748 0.082692 0.053110 0.037041 0.058269 0.040822
Когда я бегу
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.2)
Я получаю сообщение об ошибке NameError: name 'X' is not defined
Ваша помощь очень ценится. Заранее благодарим вас за ваше время.