Все примеры, с которыми я когда-либо сталкивался, всегда удобно содержат данные в одном файле, чтобы показать, как работает train_test_split (или любая модель). Но довольно часто данные обучения и данные тестирования представляют собой два отдельных файла. Итак, я сделал ультра-базовый файл поезда логистической регрессии и тестовый файл, состоящий из двух столбцов: «возраст», «страховка». И назовите df_train df, df_test.
Я понимаю, что df_test не был обучен, отсюда и ошибка, но... не в этом ли дело? Я знаю, что model.predict(X_test)
не выдает ошибку, но это основано на обучающих данных, а не на тестовых данных.
Слово предупреждения, это то, что происходит, когда вы стары и пытаетесь узнать что-то новое. Не стареть.
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(df[['age']],df.insurance,test_size=0.1)
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
model.predict(df_test)
Спасибо,
Старый пердун