Как последовательно обновлять строку за группой

У меня есть ДТ:

library(data.table)

DT <- data.table(a = c(1,2,3,4,5), b = c(4,5,6,7,8), c = c("X","X","X","Y","Y") ) 

Я хочу добавить один столбец d в каждую группу столбца C:

  • значение первой строки должно быть таким же, как b[i],
  • предпоследняя строка в каждой группе должна быть d[i-1] + 2*b[i]

Предполагаемые результаты:

   a b c d
1: 1 4 X 4
2: 2 5 X 14
3: 3 6 X 26
4: 4 7 Y 7
5: 5 8 Y 23

Я пытался использовать такие функции, как сдвиг, но я изо всех сил пытаюсь динамически обновлять строки (так сказать) здесь, интересно, есть ли какое-нибудь элегантное решение в стиле data.table?


person user253546    schedule 30.01.2020    source источник


Ответы (2)


Здесь мы можем использовать accumulate

library(purrr)
library(data.table)
DT[, d := accumulate(b, ~ .x + 2 *.y), by = c]

Или с Reduce и accumulate = TRUE из base R

DT[, d := Reduce(function(x, y) x + 2 * y, b, accumulate = TRUE), by = c]
person akrun    schedule 30.01.2020

Мы можем использовать cumsum и вычесть первую строку, используя [1]:

DT[, d := cumsum(2 * b) - b[1], .(c)][]

#>    a b c  d
#> 1: 1 4 X  4
#> 2: 2 5 X 14
#> 3: 3 6 X 26
#> 4: 4 7 Y  7
#> 5: 5 8 Y 23
person M--    schedule 30.01.2020