У меня проблема с классификацией, когда у меня есть огромный DATASET, содержащий 308 500 данных. Я хочу разделить эти данные на набор поездов и тестовый набор, чтобы создать модель.
Но я хочу, чтобы данные поезда брали, например, выборку для DATASET каждые nrows, например, каждые 1000 строк, поэтому я знаю, что набор поездов будет построен по строкам из всего DATASET. Есть ли способ сделать это?
Например, я хотел бы что-то вроде этого:
train = DATASET[take sample every 1000 rows]