В функции train пакета Caret можно выполнять центрирование и масштабирование предикторов, как в следующем примере:
knnFit <- train(Direction ~ ., data = training, method = "knn",
preProcess = c("center","scale"))
Установка этого преобразования в поезде должна дать лучшую оценку производительности алгоритма во время передискретизации.
В этом случае, когда я использую модель для прогнозирования реакции на новые данные, должен ли я заботиться о центрировании и масштабировании или эта операция включена в окончательную модель?
Достаточно ли следующей операции?
pred <- predict(knnFit, newdata = test)
Спасибо!