Свързани въпроси 'dplyr'

обединете множество колони за дата и час в колона за дата и час R
За данните по-долу: > dt date event1 event2 event3 1: 2016-04-27 10:25:15 11:05:45 13:00:09 2: 2016-04-27 10:25:15 11:05:45 13:00:09 3: 2016-04-27 10:25:15 11:05:45 13:00:09 4: 2016-04-27 10:25:15 11:05:45 13:00:09 5: 2016-04-27...
280 изгледи
schedule 19.09.2022

dplyr::mutate работи ли с колони в стил запис?
Наскоро тествах пакета vctrs, особено това, което наскоро наричат ​​обекти в стил "запис", и се чудя дали има някакъв начин да ги накарам да играят добре с dplyr::mutate. В момента, когато dplyr::mutate ми дава грешка относно дължината на обектите,...
67 изгледи
schedule 21.09.2022

Как да изчислим променлива с помощта на лагирана стойност с помощта на R
Да предположим, че имам прост набор от данни df <- data.frame(id=c("A","B","C","D","E","F"), value=c(1,NA,NA,NA,NA,NA)) Искам да прекодирам стойност (или да създам нова променлива), така че всяка следваща стойност да е...
57 изгледи
schedule 15.09.2022

Използвайте bind_rows, за да конвертирате списък с вектори в рамка с данни
Имам списък с вектори, които бих искал да конвертирам в рамка с данни. Код a <- list( c(1,2,3,4), c(1,2,3,4), c(4,5,6,3), c(6,3,2,6)) С помощта на тази публикация успях да го направя в по следния...
220 изгледи
schedule 18.09.2022

tidyr::pivot_longer идва с :Грешка: Не мога да комбинирам `TSPAN6` ‹character› и `MT-CO2` ‹double›
Опитвам се да използвам функцията pivot_longer, за да конвертирам дълъг ред от идентификатори на гени в по-дълга колона. Използвам следния код: file1 <- file1 %>% tidyr::pivot_longer(cols = -Gene.ID, names_to = "tissue",...
439 изгледи
schedule 16.09.2022

Избягване на липсващ ред след обобщаване
Използвам RStudio версия 0.98.1028 на Windows. Обобщавайки рамка с данни на много нива, пакет dplyr , използвайки функцията sum(), загубих ред, който имаше sum = 0 . С други думи, ако оригиналната ми рамка с данни беше нещо подобно group <-...
104 изгледи
schedule 26.09.2022

Използване на plyr::mapvalues ​​с dplyr
plyr::mapvalues може да се използва така: mapvalues(mtcars$cyl, c(4, 6, 8), c("a", "b", "c")) Но това не работи: mtcars %>% dplyr::select(cyl) %>% mapvalues(c(4, 6, 8), c("a", "b", "c")) %>% as.data.frame() Как мога да...
18741 изгледи
schedule 24.09.2022

Филтрирайте по един ред всяка година
Опитвам се да филтрирам списък с дати, за да включвам дати само веднъж годишно, което се нулира при всяка дата на включване. В таблицата по-долу бих искал да филтрирам само редовете, където include=1 (за този пример създадох ръчно колоната...
132 изгледи
schedule 21.09.2022

Трансформирайте елементи в колона с името на колоната като аргумент
Опитвам се да модифицирам данните в набор от данни въз основа на вектор от колони за промяна. По този начин бих могъл да факторизирам лечението въз основа на конфигурационен файл, който ще има списък с колони за промяна като променлива. В идеалния...
52 изгледи
schedule 27.09.2022

multidplyr и group_by () и filter()
Имам следната рамка от данни и моето намерение е да намеря всички идентификатори, които имат различно ИЗПОЛЗВАНЕ, но един и същ ТИП. ID <- rep(1:4, each=3) USAGE <- c("private","private","private","private",...
1964 изгледи
schedule 26.09.2022

Замяна на NA в зависимост от типа разпределение на пола в R
Когато избрах NA стойност тук data[data=="na"] <- NA data[!complete.cases(data),] трябва да го сменя, но в зависимост от вида на разпространението. Ако използвате Shapiro.test, разпределението по променливи не е нормално, тогава...
106 изгледи
schedule 23.09.2022

Грешка при използването на contains() във филтърната команда на dplyr
Опитвам се да филтрирам стойностите на колона 2010. Действителното име на колона е "Y2010". Знам, че мога да получа изхода по лесния начин, но се опитвам да използвам function contains() , за да извлека стойностите на колоната Y2010, които са...
220 изгледи
schedule 26.09.2022

бързи, правилни изчисления на разстоянието
Имам голяма рамка от данни (> 8 милиона реда) с наблюдения на хора и различни сайтове. Интересувам се да разгледам близостта на тези сайтове до няколко ключови места (1 местоположение през 2014 г. и 2 местоположения през 2015 г.). За да...
69 изгледи
schedule 27.09.2022

Подвижна 7-дневна сума, групирана по дата и уникален идентификатор
Използвам данни за работното натоварване, за да изчисля 3 показателя - Daily , 7-Day rolling (сума от последните 7 дни) 28-Day Rolling Average (сума от последните 28 дни/4). Успях да изчисля с Daily , но имам нужда от моите 7-Day rolling и...
109 изгледи
schedule 23.09.2022

Как да завъртите рамка с данни, състояща се от колона със секция и подсекция в R
Имам по-долу споменатата рамка от данни: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16...
628 изгледи
schedule 21.09.2022

Как да създадете нова колона, която следва определен модел?
Имам рамка с данни df, която съдържа хранителни стойности. Трябва да създам нова колона диабетик, в която трябва да има да за първите два реда и не в третия ред. df <- data.frame(nutrition = c(199,200,350,175,226,400)) Очакваният резултат...
46 изгледи
schedule 24.09.2022

Как да изчислим средните темпове на растеж за 5 години на група променливи в панелен набор от данни в R
Искам да изчисля 5-годишен среден темп на растеж на някои променливи в моята база данни, групирани по кода на променливата. Това означава, че през първите 4 години от всяка променлива трябва да имам NA. базата данни може да бъде изтеглена тук...
52 изгледи
schedule 24.09.2022

Tibbles и имена на колони, дефинирани от данни
Използвам tibbles в собствените си функции, които обикновено приемат имена на променливи като аргументи. Така че основно, вместо да правите tibble %>% do_something(foo) Правя много function(bar){ tibble %>% do_something(bar) }...
28 изгледи
schedule 27.09.2022

определяне на най-краткото разстояние между UTM точки в два набора от данни R
Опитвам се да намеря най-краткото разстояние между училищата и бреговата линия. Всички училища са в източен и северен формат, бреговата линия е съставена от точки, също в източен и северен формат. Реших това, като имах цикъл, който минава през...
281 изгледи
schedule 03.10.2022

Изчислете средната стойност с помощта на rollapply само ако има определен процент от данните
Имам колона с почасови данни и искам да използвам rollapply за изчисляване на 24-часовата подвижна средна стойност за всеки час. Моите данни съдържат NA и искам да изчисля подвижната средна стойност само ако са налични 75% от данните за един...
169 изгледи
schedule 29.09.2022