Привет, я создал способ рекомендовать фильмы из набора данных Movielens. Проблема со мной в том, как разделить таблицу в базе данных на основе просмотренных пользователем фильмов на складки для применения перекрестной проверки. Этот пример подробно объясняет то, что я ищу. Предположим, кто-то посмотрел 12 фильмов, и я применю трехкратную перекрестную проверку, поэтому мне нужно иметь 1 набор в качестве теста и 3 набора в качестве обучения, где 12/3 = 4, что является количеством наборов. Чтобы оценить мой рекомендательный метод, мне нужно сравнить прогнозы тестового набора с другими наборами один за другим, поэтому мне нужно получить пользовательский фильм в 4 группах, не содержащих повторяющихся фильмов. Кто-нибудь знает, как получить данные следующего примера в наборы в базе данных mysql?
ID| User_ID| Movie_ID| Movie_Title| Movie_Genre| Rating|
107747| 3| 480| Jurassic Park| Adventure| 4|
107748| 3| 590| Dances with Wolves| Drama, Western| 4|
107749| 3| 648| Mission: Impossible| Action| 3|
107750| 3| 1198| Raiders of the Lost Ark| Adventure| 5|
107751| 3| 1259| Stand by Me| Drama| 5|
107752| 3| 1266| Unforgiven| Western| 5|
107753| 3| 1270| Back to the Future| Sci-Fi| 3|
107754| 3| 1291| Indiana Jones and the Last Crusade| Action| 4|
107755| 3| 1378| Young Guns| Western| 5|
107756| 3| 1379| Young Guns II| Western| 4|
107757| 3| 1394| Raising Arizona| Comedy| 4|
107758| 3| 1431| Beverly Hills Ninja| Comedy| 3|
Итак, я пытаюсь получить эти 12 фильмов как 3 группы, где каждая группа содержит 4 фильма, где эти группы содержат уникальные фильмы, другими словами, фильм не должен существовать более чем в группе. Я использую Java для извлечения этих данных из базы данных. Любая помощь с этим приветствуется.