проблем с дефиницията на аргумент на функцията в R

Тук е моят проблем, когато искам да разработя функция за широко използване.

dataframe1 <- data.frame(V1 = 1:10, V2 = 11:20, V3 = 21:30, V4 = 31:40)
myfun <- function (dataframe, A, B, yvar) {
                  dataframe1$A <- as.factor(dataframe$A)
                  dataframe1$B <- as.factor (dataframe$B)
                  dataframe1 <- data.frame(A = dataframe1$A, 
                  B = dataframe1$B, yvar = dataframe1$yvar)
                  print(dataframe1)
                  }

 myfun (dataframe = dataframe1, A = "V1", B= "V2", yvar = "V3")
 Error in `$<-.data.frame`(`*tmp*`, "A", value = integer(0)) :
  replacement has 0 rows, data has 10

myfun (dataframe = dataframe1, A = dataframe1$V1, 
         B= dataframe1$V2, yvar = dataframe1$V3)
Error in `$<-.data.frame`(`*tmp*`, "A", value = integer(0)) :
  replacement has 0 rows, data has 10

Бих искал да дефинирам с помощта на първия тип дефиниция, където аргументът за име на променлива е в "скоби" вместо "datafile$variablename"


person jon    schedule 19.11.2011    source източник
comment
Изглежда, че този въпрос е задаван и преди   -  person hadley    schedule 19.11.2011
comment
Намерих точния въпрос, мога да видя подобен, но различен въпрос на - stackoverflow.com/questions/8121542/, надявам се, че това не е причина за отрицателен вот ! Ако някой може да ме насочи към същия въпрос, ще се радвам дори да затворя този пост ...   -  person jon    schedule 19.11.2011


Отговори (2)


Просто трябва да не използвате $ като селектор на колони. Вместо това използвайте [:

dataframe[,A]

or

dataframe[,B]

и така нататък. Във вашия случай:

dataframe1 <- data.frame(V1 = 1:10, V2 = 11:20, V3 = 21:30, V4 = 31:40)
myfun <- function (dataframe, A, B, yvar) {
                   dataframe1[,A] <- as.factor(dataframe[,A])
                   dataframe1[,B] <- as.factor (dataframe[,B])
                   dataframe1 <- data.frame(A = dataframe1[,A], 
                   B = dataframe1[,B], yvar = dataframe1[,yvar])
                   print(dataframe1)
                   }

myfun (dataframe = dataframe1, A = "V1", B= "V2", yvar = "V3")

    A  B yvar
1   1 11   21
2   2 12   22
3   3 13   23
4   4 14   24
5   5 15   25
6   6 16   26
7   7 17   27
8   8 18   28
9   9 19   29
10 10 20   30
person joran    schedule 19.11.2011
comment
благодаря ви за сладкия отговор, чудя се разликата в селекторите на колони $ и [,C1]? - person jon; 19.11.2011
comment
dataframe$A търси колона с име A. Ако A съдържа низ, тогава dataframe[,A] търси колона, която е наименувана както съдържа A. - person Dason; 19.11.2011
comment
Кръг 8.1.39 от „The R Inferno“ може да помогне. burns-stat.com/pages/Tutor/R_inferno.pdf - person Patrick Burns; 19.11.2011

Директният отговор на вашия въпрос е да използвате [ индексиране, а не $ индексиране, тъй като $ индексирането не позволява непряко подмножество.

Освен това можете значително да подобрите четливостта на вашата функция, като използвате един израз data.frame, без да дефинирате никакви междинни променливи:

myfun <- function (dataframe, A, B, yvar) {
  data.frame(
      A = as.factor(dataframe[, A]), 
      B = as.factor(dataframe[, B]),
      yvar = dataframe[, yvar]
  )
}

myfun(dataframe1, "V1", "V2", "V3")
    A  B yvar
1   1 11   21
2   2 12   22
3   3 13   23
4   4 14   24
5   5 15   25
6   6 16   26
7   7 17   27
8   8 18   28
9   9 19   29
10 10 20   30
person Andrie    schedule 19.11.2011