Прогнозирование модели Randomforest

Я реализовал случайный лес, а затем начал прогнозировать индекс площади листа в лесу с использованием 10 переменных, но когда прогнозирование прекращается, результатом прогноза является пустая карта с нулевыми значениями. Я ценю, если кто-то мне в этом поможет. Я добавляю сюда код, который я запускаю.

Здесь, на первом этапе, я присваиваю ноль значениям NA в растрах.

tex37$glcm_variance_ENVI[is.na(tex37$glcm_variance_ENVI)] <- 0
tex37$glcm_entropy[is.na(tex37$glcm_entropy)] <- 0
RVI_raster3$glcm_mean_ENVI[is.na(RVI_raster3$glcm_mean_ENVI)] <- 0
RVI_raster3$glcm_mean[is.na(RVI_raster3$glcm_mean)] <- 0
RVI_raster3$glcm_variance[is.na(RVI_raster3$glcm_variance)] <- 0
RVI_raster5$glcm_mean_ENVI[is.na(RVI_raster5$glcm_mean_ENVI)] <- 0
RVI_raster5$glcm_variance[is.na(RVI_raster5$glcm_variance)] <- 0
RVI_raster5$glcm_mean[is.na(RVI_raster5$glcm_mean)] <- 0
RVI_raster7$glcm_mean_ENVI[is.na(RVI_raster7$glcm_mean_ENVI)] <- 0
RVIrededge[is.na(RVIrededge)] <- 0

Здесь я складываю все мои 10 растровых слоев в один растр.

image_stack_imp = stack(tex37$glcm_variance_ENVI,
                     tex37$glcm_entropy,
                     RVI_raster3$glcm_mean_ENVI,
                     RVI_raster3$glcm_mean,
                     RVI_raster3$glcm_variance,
                     RVI_raster5$glcm_mean_ENVI,
                     RVI_raster5$glcm_variance,
                     RVI_raster5$glcm_mean,
                     RVI_raster7$glcm_mean_ENVI,
                     RVIrededge)

Я сделал таблицу из своей функции, плюс указатель площади листа в качестве метки.

Table_Importance = data.frame(LAI=d$LAI,
                          tex37.glcm_variance_ENVI=LAI37$glcm_variance_ENVI,
                          tex37.glcm_entropy=LAI37$glcm_entropy,
                          RVI_raster3.glcm_mean_ENVI=RVI3$glcm_mean_ENVI,
                          RVI_raster3.glcm_variance=RVI3$glcm_variance,
                          RVI_raster3.glcm_mean=RVI3$glcm_mean,
                          RVI_raster5.glcm_variance=RVI5$glcm_variance,
                          RVI_raster5.glcm_mean_ENVI=RVI5$glcm_mean_ENVI,
                          RVI_raster5.glcm_mean=RVI5$glcm_mean,
                          RVI_raster7.glcm_mean_ENVI=RVI7$glcm_mean_ENVI,
                          RVIrededge_values)

И, наконец, запускаем Randomforest:

set.seed(104)
ind <- sample(2, nrow(Table_Importance), replace = 1, prob=c(0.66,0.33))
rf_imp<- randomForest(LAI ~ ., data=Table_Importance[ind ==     1,],importance=TRUE, ntree=1000, mtry=3)
pred_imp <- predict(rf_imp, Table_Importance[ind == 2,])
rmse(Table_Importance[ind==2, "LAI"], pred_imp)
###############################predicting########################
Map_LAI = predict(image_stack_imp, rf_imp,na.rm = TRUE, progress='window', type ='response')
plot(Map_LAI)

Вот небольшой образец:

(head(Table_Importance, 20)

person S.amn    schedule 05.01.2016    source источник
comment
Можете ли вы привести (небольшой) воспроизводимый пример?   -  person Roman Luštrik    schedule 05.01.2016
comment
Извините, я новичок в stackoverflow и точно не знаю, как это сделать? потому что для каждой переменной существуют разные команды, выполнение которых требует времени. какую часть кода лучше сюда загрузить?   -  person S.amn    schedule 05.01.2016
comment
dput (head (Table_Importance, 20)) даст нам первые 20 строк вашего Table_Importance. Вот что входит в Randomforest. Но сначала проверьте, не получаете ли вы никаких ошибок от функции прогнозирования и соответствуют ли данные в Table_Importance тем, которые вы ожидаете. Никаких NA, только нули и т. Д.   -  person phiver    schedule 05.01.2016
comment
Я проверил значения NA, в таблице их нет. Ошибка функции прогнозирования возникла из-за значений NA на моем изображении, и я заменяю их нулем, как я показал ранее. Я добавил образец своей таблицы.   -  person S.amn    schedule 05.01.2016


Ответы (1)


Сам обнаружил проблему: D ответ только то, что имя атрибутов таблицы должно совпадать с именем таблицы обучения. В моем случае имена атрибутов следующие:

Table_Importance = data.frame(LAI=d$LAI,
                          glcm_variance_ENVI=LAI37$glcm_variance_ENVI,
                          glcm_entropy=LAI37$glcm_entropy,
                          glcm_mean_ENVI.1=RVI3$glcm_mean_ENVI,
                          glcm_variance.1=RVI3$glcm_variance,
                          glcm_mean.1=RVI3$glcm_mean,
                          glcm_variance.2=RVI5$glcm_variance,
                          glcm_mean_ENVI.2=RVI5$glcm_mean_ENVI,
                          glcm_mean.2=RVI5$glcm_mean,
                          glcm_mean_ENVI.3=RVI7$glcm_mean_ENVI,
                          layer=RVIrededge_values)
person S.amn    schedule 05.01.2016