Объект из as.h2o имеет небольшое наблюдение в R

Я попытался преобразовать данные R в данные h2o, используя функцию as.h2o.

Однако количество наблюдений, преобразованных функцией as.h2o, сокращается до 10.

Всего в моих данных 1000 наблюдений. Имеется 700 данных поездов и 300 тестовых данных. Однако использование функции as.h2o дает только 10 наблюдений.

Ниже приведен мой полный и открытый исходный код. Вы можете использовать его. пожалуйста, помогите мне.

Почему данные, преобразованные в данные о воде, имеют 10 наблюдений?

install.packages("h2o")
library(h2o)
h2o.init(max_mem_size = "10G", nthreads = -1)

df<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE)
F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21)
for(i in F) df[,i]=as.factor(df[,i])

library(caret)

set.seed(1000)
intrain<-createDataPartition(y=df$Creditability, p=0.7, list=FALSE)
train<-df[intrain, ]
test<-df[-intrain, ]
str(train)
str(test)

h2o_train<-as.h2o(train, destination_frame = "h2o_train")
h2o_test<-as.h2o(test, destination_frame = "h2o_test")
str(h2o_train)
str(h2o_test)

person 이순우    schedule 26.07.2017    source источник


Ответы (1)


Похоже, это странность того, как str() отображает H2OFrames, а не реальная проблема. Если вы посмотрите в Flow (localhost:54321) или вызовете nrow() для объектов h2o, вы увидите ожидаемые результаты.

person Richard    schedule 26.07.2017
comment
Это ошибка только в распечатке. Посмотрите на nrow(h2o_train), чтобы проверить размер. Я подал отчет об ошибке здесь: 0xdata.atlassian.net/browse/PUBDEV-4742 - person Erin LeDell; 28.07.2017