Caret - възможно ли е да запазите всеки модел от настройка?

Използвам caret, за да обучавам модели върху повторни проби и да настройвам параметрите за обучение и мога да разпитам вероятностите за всеки тест, което е страхотно. Но също така искам да запазя моделните обекти и да ги използвам по-късно без повторно обучение - възможно ли е това? По принцип, вместо само обекта mdl$finalModel, бих искал обекта модел за всяка итерация на настройка.


person Shane    schedule 10.11.2014    source източник


Отговори (2)


Не точно. Можете да напишете персонализиран метод и да промените функцията fit, за да ги запишете в файл. Във функцията fit ще знаете стойността на параметъра за настройка, но не и с каква повторна семпла е изграден моделът.

Макс

person topepo    schedule 14.11.2014

Благодаря Макс. Използвам вашето предложение, така че публикувам кода си тук, ако някой друг иска да опита това. Работя по повторната семпла по-късно, като също така запазвам rownames(x).

# Copy all model structure info from existing model type
cust.mdl <- getModelInfo("rf", regex=FALSE)[[1]]

# Override fit function so that we can save the iteration
cust.mdl$fit <- function(x=x, y=y, wts=wts, param=param, lev=lev, last=last, classProbs=classProbs, ...) {
  # Dont save the final pass (dont train the final model across the entire training set)
  if(last == TRUE) return(NULL) 

  # Fit the model
  fit.obj <- getModelInfo("rf", regex=FALSE)[[1]]$fit(x, y, wts, param, lev, last, classProbs, ...)

  # Create an object with data to save and save it
  fit.data <- list(resample=rownames(x),
                   mdl=fit.obj,
                   #x, y, wts,
                   param=param, lev=lev, last=last, classProbs=classProbs, 
                   other=list(...))

  # Create a string representing the tuning params
  param.str <- paste(lapply(1:ncol(param), function(x) {
                     paste0(names(param)[x], param[1,x])
                    }), collapse="-")

  save(fit.data, file=paste0("rf_modeliter_", sample(1000:9999,1), "_", param.str, ".RData"))
  return (fit.obj)
}
person Shane    schedule 19.02.2015