Как получить data.frame в многомерный массив в R?

Я ищу более универсальный способ перехода от data.frame к многомерному массиву.

Я хотел бы иметь возможность создавать столько измерений, сколько необходимо, из любого количества переменных во фрейме данных.

В настоящее время метод должен быть адаптирован к каждому кадру данных, требует субаренды для формирования вектора.

Мне бы хотелось что-нибудь по методам плавления/отливки в plyr.

   data<-data.frame(coord.name=rep(1:10, 2),
             x=rnorm(20),
             y=rnorm(20),
             ID=rep(c("A","B"), each=10))


    data.array<-array(dim=c(10, 2, length(unique(data$ID))))

    for(i in 1:length(unique(data$ID))){
      data.array[,1,i]<-data[data$ID==unique(data$ID)[i],"x"]
      data.array[,2,i]<-data[data$ID==unique(data$ID)[i],"y"]
    }

data.array
, , 1

      [,1] [,2]
 [1,]    1    1
 [2,]    3    3
 [3,]    5    5
 [4,]    7    7
 [5,]    9    9
 [6,]    1    1
 [7,]    3    3
 [8,]    5    5
 [9,]    7    7
[10,]    9    9

, , 2

      [,1] [,2]
 [1,]    2    2
 [2,]    4    4
 [3,]    6    6
 [4,]    8    8
 [5,]   10   10
 [6,]    2    2
 [7,]    4    4
 [8,]    6    6
 [9,]    8    8
[10,]   10   10

person Etienne Low-Décarie    schedule 05.04.2012    source источник
comment
... у вас всегда будет 2 числовых столбца, а затем ноль или более столбцов факторов?   -  person Tommy    schedule 06.04.2012


Ответы (2)


Возможно, у вас возникли проблемы с применением функций reshape2 по довольно тонкой причине. Сложность заключалась в том, что в вашем data.frame нет столбца, который можно использовать для указания того, как вы хотите расположить элементы по первому измерению выходного массива.

Ниже я явно добавляю такой столбец, называя его "row". Имея его на месте, вы можете использовать выразительные функции acast() или dcast() для изменения формы данных любым способом по вашему выбору.

library(reshape2)

# Use this or some other method to add a column of row indices.
data$row <- with(data, ave(ID==ID, ID, FUN = cumsum))

m <- melt(data, id.vars = c("row", "ID"))
a <- acast(m, row ~ variable ~ ID)

a[1:3, , ]
# , , A
# 
#   x y
# 1 1 1
# 2 3 3
# 3 5 5
#
# , , B
# 
#   x y
# 1 2 2
# 2 4 4
# 3 6 6
person Josh O'Brien    schedule 05.04.2012

Я думаю, это правильно:

array(unlist(lapply(split(data, data$ID), function(x) as.matrix(x[ , c("x", "y")]))), c(10, 2, 2))
person mdsumner    schedule 05.04.2012