Свързани въпроси 'dplyr'
обединете множество колони за дата и час в колона за дата и час R
За данните по-долу:
> dt
date event1 event2 event3
1: 2016-04-27 10:25:15 11:05:45 13:00:09
2: 2016-04-27 10:25:15 11:05:45 13:00:09
3: 2016-04-27 10:25:15 11:05:45 13:00:09
4: 2016-04-27 10:25:15 11:05:45 13:00:09
5: 2016-04-27...
280 изгледи
schedule
19.09.2022
dplyr::mutate работи ли с колони в стил запис?
Наскоро тествах пакета vctrs, особено това, което наскоро наричат обекти в стил "запис", и се чудя дали има някакъв начин да ги накарам да играят добре с dplyr::mutate. В момента, когато dplyr::mutate ми дава грешка относно дължината на обектите,...
67 изгледи
schedule
21.09.2022
Как да изчислим променлива с помощта на лагирана стойност с помощта на R
Да предположим, че имам прост набор от данни
df <- data.frame(id=c("A","B","C","D","E","F"),
value=c(1,NA,NA,NA,NA,NA))
Искам да прекодирам стойност (или да създам нова променлива), така че всяка следваща стойност да е...
57 изгледи
schedule
15.09.2022
Използвайте bind_rows, за да конвертирате списък с вектори в рамка с данни
Имам списък с вектори, които бих искал да конвертирам в рамка с данни.
Код
a <- list( c(1,2,3,4),
c(1,2,3,4),
c(4,5,6,3),
c(6,3,2,6))
С помощта на тази публикация успях да го направя в по следния...
220 изгледи
schedule
18.09.2022
tidyr::pivot_longer идва с :Грешка: Не мога да комбинирам `TSPAN6` ‹character› и `MT-CO2` ‹double›
Опитвам се да използвам функцията pivot_longer, за да конвертирам дълъг ред от идентификатори на гени в по-дълга колона. Използвам следния код:
file1 <- file1 %>%
tidyr::pivot_longer(cols = -Gene.ID, names_to = "tissue",...
439 изгледи
schedule
16.09.2022
Избягване на липсващ ред след обобщаване
Използвам RStudio версия 0.98.1028 на Windows. Обобщавайки рамка с данни на много нива, пакет dplyr , използвайки функцията sum(), загубих ред, който имаше sum = 0 . С други думи, ако оригиналната ми рамка с данни беше нещо подобно
group <-...
104 изгледи
schedule
26.09.2022
Използване на plyr::mapvalues с dplyr
plyr::mapvalues може да се използва така:
mapvalues(mtcars$cyl, c(4, 6, 8), c("a", "b", "c"))
Но това не работи:
mtcars %>%
dplyr::select(cyl) %>%
mapvalues(c(4, 6, 8), c("a", "b", "c")) %>%
as.data.frame()
Как мога да...
18741 изгледи
schedule
24.09.2022
Филтрирайте по един ред всяка година
Опитвам се да филтрирам списък с дати, за да включвам дати само веднъж годишно, което се нулира при всяка дата на включване.
В таблицата по-долу бих искал да филтрирам само редовете, където include=1 (за този пример създадох ръчно колоната...
132 изгледи
schedule
21.09.2022
Трансформирайте елементи в колона с името на колоната като аргумент
Опитвам се да модифицирам данните в набор от данни въз основа на вектор от колони за промяна. По този начин бих могъл да факторизирам лечението въз основа на конфигурационен файл, който ще има списък с колони за промяна като променлива.
В идеалния...
52 изгледи
schedule
27.09.2022
multidplyr и group_by () и filter()
Имам следната рамка от данни и моето намерение е да намеря всички идентификатори, които имат различно ИЗПОЛЗВАНЕ, но един и същ ТИП.
ID <- rep(1:4, each=3)
USAGE <- c("private","private","private","private",...
1964 изгледи
schedule
26.09.2022
Замяна на NA в зависимост от типа разпределение на пола в R
Когато избрах NA стойност тук
data[data=="na"] <- NA
data[!complete.cases(data),]
трябва да го сменя, но в зависимост от вида на разпространението. Ако използвате Shapiro.test, разпределението по променливи не е нормално, тогава...
106 изгледи
schedule
23.09.2022
Грешка при използването на contains() във филтърната команда на dplyr
Опитвам се да филтрирам стойностите на колона 2010. Действителното име на колона е "Y2010". Знам, че мога да получа изхода по лесния начин, но се опитвам да използвам function contains() , за да извлека стойностите на колоната Y2010, които са...
220 изгледи
schedule
26.09.2022
бързи, правилни изчисления на разстоянието
Имам голяма рамка от данни (> 8 милиона реда) с наблюдения на хора и различни сайтове. Интересувам се да разгледам близостта на тези сайтове до няколко ключови места (1 местоположение през 2014 г. и 2 местоположения през 2015 г.).
За да...
69 изгледи
schedule
27.09.2022
Подвижна 7-дневна сума, групирана по дата и уникален идентификатор
Използвам данни за работното натоварване, за да изчисля 3 показателя - Daily , 7-Day rolling (сума от последните 7 дни) 28-Day Rolling Average (сума от последните 28 дни/4).
Успях да изчисля с Daily , но имам нужда от моите 7-Day rolling и...
109 изгледи
schedule
23.09.2022
Как да завъртите рамка с данни, състояща се от колона със секция и подсекция в R
Имам по-долу споменатата рамка от данни:
structure(
list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7",
"P-8"),
Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04",
"2020-03-16...
628 изгледи
schedule
21.09.2022
Как да създадете нова колона, която следва определен модел?
Имам рамка с данни df, която съдържа хранителни стойности. Трябва да създам нова колона диабетик, в която трябва да има да за първите два реда и не в третия ред.
df <- data.frame(nutrition = c(199,200,350,175,226,400))
Очакваният резултат...
46 изгледи
schedule
24.09.2022
Как да изчислим средните темпове на растеж за 5 години на група променливи в панелен набор от данни в R
Искам да изчисля 5-годишен среден темп на растеж на някои променливи в моята база данни, групирани по кода на променливата. Това означава, че през първите 4 години от всяка променлива трябва да имам NA. базата данни може да бъде изтеглена тук...
52 изгледи
schedule
24.09.2022
Tibbles и имена на колони, дефинирани от данни
Използвам tibbles в собствените си функции, които обикновено приемат имена на променливи като аргументи. Така че основно, вместо да правите
tibble %>% do_something(foo)
Правя много
function(bar){
tibble %>% do_something(bar)
}...
28 изгледи
schedule
27.09.2022
определяне на най-краткото разстояние между UTM точки в два набора от данни R
Опитвам се да намеря най-краткото разстояние между училищата и бреговата линия. Всички училища са в източен и северен формат, бреговата линия е съставена от точки, също в източен и северен формат.
Реших това, като имах цикъл, който минава през...
281 изгледи
schedule
03.10.2022
Изчислете средната стойност с помощта на rollapply само ако има определен процент от данните
Имам колона с почасови данни и искам да използвам rollapply за изчисляване на 24-часовата подвижна средна стойност за всеки час. Моите данни съдържат NA и искам да изчисля подвижната средна стойност само ако са налични 75% от данните за един...
169 изгледи
schedule
29.09.2022