Данные основаны на наборе данных из Kaggle здесь и извлечены в R.
Используя следующую структуру:
Index VisitorId VisitId Visit# Hit# pagePath
0 000722514342430295 1470093727 1 1 /home
1 000722514342430295 1470093727 1 3 /google+redesign/apparel
2 000722514342430295 1470093727 1 4 /asearch.html
3 000722514342430295 1470093727 1 5 /asearch.html
4 0014659935183303341 1470037282 1 1 /home
5 0015694432801235877 1470043732 1 1 /home
6 0015694432801235877 1470043732 1 2 /google+redesign/electronics
7 0015694432801235877 1470043732 1 3 /google+redesign/apparel/men++s/men++s+t+shirts
8 0015694432801235877 1470043732 1 4 /google+redesign/apparel/kid+s/kid+s+infant
9 0015694432801235877 1470043732 1 5 /google+redesign/apparel/kid+s/kid+s+infant/quickview
Я пытаюсь реализовать функцию задержки изменения, которая будет возвращать предыдущий путь к странице для данного посещения данного посетителя.
Например, новый столбец prev_path
будет относиться как к идентификатору посетителя, так и к идентификатору посещения, и будет отставать от Hit # на 1, но будет возвращать <NA>
, если он недоступен в случае посещения 1, Hit 2.
mutate(ifelse(condition, do this is true, do this if false))
. Я бы написал конкретный код, но не совсем понимаю условие, не могли бы вы уточнить, пожалуйста? В идеале вы можете записать ожидаемый выходной фрейм данных - person Amit Kohli   schedule 26.08.2019