Я понимаю, как использовать split
, lapply
и объединить выходные данные списка вместе, используя базу R. Я пытаюсь понять способ мурлыкать для этого. Я могу сделать это с базовым R и даже с purrr *, но предполагаю, поскольку я, кажется, дублирую переменную order
, что я делаю это неправильно. Это кажется неуклюжим, так что я не думаю, что понимаю.
Каков подход tidyverse к использованию информации из подмножеств данных для создания вложенного выходного столбца?
Базовый подход R для создания вложенного столбца во фрейме данных
library(tidyverse)
set.seed(10)
dat2 <- dat1 <- data_frame(
v1 = LETTERS[c(1, 1, 1, 1, 2, 2, 2, 2)],
v2 = rep(1:4, 2),
from = c(1, 3, 2, 1, 3, 5, 2, 1),
to = c(1, 3, 2, 1, 3, 5, 2, 1) + sample(1:3, 8, TRUE)
)
dat1 <- split(dat1, dat1[c('v1', 'v2')]) %>%
lapply(function(x){
x$order <- list(seq(x$from, x$to))
x
}) %>%
{do.call(rbind, .)}
dat1
unnest(dat1)
Мой мурлыкающий подход (каков правильный?)
dat2 %>%
group_by(v1, v2) %>%
nest() %>%
mutate(order = purrr::map(data, ~ with(., seq(from, to)))) %>%
select(-data)
Желаемый результат
v1 v2 from to order
* <chr> <int> <dbl> <dbl> <list>
1 A 1 1 3 <int [3]>
2 B 1 3 4 <int [2]>
3 A 2 3 4 <int [2]>
4 B 2 5 6 <int [2]>
5 A 3 2 4 <int [3]>
6 B 3 2 3 <int [2]>
7 A 4 1 4 <int [4]>
8 B 4 1 2 <int [2]>
outs
располагаются в другом порядке, чем они отображаются во фрейме данных ... - person joran   schedule 17.12.2018mutate(dat2,order = map2(.x = from,.y = to,.f = seq))
. - person joran   schedule 17.12.2018