Данные обучающего теста Python SKLearn

Это мой первый опыт работы с машинным обучением. У меня есть задание запустить логистическую и байесовскую регрессию от Sklearn на доходности акций яблок и сравнить это с линейной регрессией + тензорный поток. Я не уверен, правильно ли я понимаю, что перед запуском логистической регрессии я должен обучить свой набор данных. Я пытался сделать так, чтобы мои данные выглядели так:

Closing_Price   Daily_Returns   Daily_Returns_1 Daily_Returns_2 Daily_Returns_3 Daily_Returns_4 Daily_Returns_5
Date                            
1980-12-22  0.53    0.058269    0.040822    0.042560    0.021979    -0.085158   -0.040005
1980-12-23  0.55    0.037041    0.058269    0.040822    0.042560    0.021979    -0.085158
1980-12-24  0.58    0.053110    0.037041    0.058269    0.040822    0.042560    0.021979
1980-12-26  0.63    0.082692    0.053110    0.037041    0.058269    0.040822    0.042560
1980-12-29  0.64    0.015748    0.082692    0.053110    0.037041    0.058269    0.040822

Когда я бегу

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.2)

Я получаю сообщение об ошибке NameError: name 'X' is not defined

Ваша помощь очень ценится. Заранее благодарим вас за ваше время.


person Varun    schedule 04.06.2019    source источник
comment
Это именно то, что говорит ошибка. Вы не определили переменную X, которую хотите передать в функцию train_test_split.   -  person Florian H    schedule 04.06.2019
comment
@FlorianH спасибо, мой друг тоже это понял, прочитав пример на другом сайте. Люди дают уроки и упускают больше половины материала, и они даже не говорят, что упускают половину материала.   -  person Varun    schedule 04.06.2019


Ответы (1)


Смотрел много видео на ютубе, почему-то об этом не говорят. Нужно определить X и y как:

X = apple['Closing_Price'].values.reshape(-1,1)

y = apple['Daily_Returns'].values.reshape(-1,1)

person Varun    schedule 04.06.2019