настройка начального значения для функции поезда в пакете каретки для RepeatCV

Мне нужно определить настройку начального числа для RepeatCV для модели KNN, используя пакет каретки в R.

Мой набор данных поезда имеет 12 столбцов и 1000 строк (столбец 1 в двоичном ответе и другие 11 столбцов являются стандартизированными переменными-предикторами)

Как я могу правильно определить настройку начального числа для «repeatedCV» 50-кратного и 5-кратного повторения?

Верна ли приведенная ниже установка семян?

Может ли кто-нибудь помочь понять правильную настройку начальных значений для RepeatCV и LOOCV?

Пожалуйста, смотрите мой код ниже.

set.seed(123)
seeds <- vector(mode = "list", length = 251)
for(i in 1:250) seeds[[i]] <- sample.int(1000, 11) 

## For the last model:
seeds[[251]] <- sample.int(1000, 1)

person user3408139    schedule 26.07.2017    source источник


Ответы (1)


11 в sample.int() должны быть значениями параметров.
В этом случае, если вы хотите оценить 11 значений K для KNN в каждой модели, выберите 11. В деталях у вас будет 10 модели в одном повторении 10-кратного CV для усреднения. В каждой из 10 моделей train() попробует 11 значений K.
На 2 похожих вопроса уже есть отличные ответы.
Установить исходный параллельный случайный лес в каретке
Полностью воспроизводимые параллельные модели с использованием знака вставки

person Guannan Shen    schedule 20.04.2018