Вопросы по теме 'tidyverse'

Моделирование временного ряда в dplyr вместо использования цикла for
Так что, хотя lag и lead в dplyr великолепны, я хочу смоделировать временной ряд чего-то вроде роста населения. Мой старый школьный код выглядел бы примерно так: tdf <- data.frame(time=1:5, pop=50) for(i in 2:5){ tdf$pop[i] =...
1152 просмотров
schedule 03.04.2024

Неожиданные значения при применении пользовательской функции в dplyr :: mutate
Мои данные выглядят так: library(tidyverse) df <- tribble( ~y_val, ~z_val, 2, 4, 5, 3, 8, 2, 1, 1, 9, 3) У меня есть пользовательская функция fun_b() , которую я хотел бы применить к фрейму данных с помощью...
69 просмотров
schedule 26.11.2022

Как преобразовать список списка в аккуратный тиббл или data.frame в R
У меня есть следующий список: my_lol <- structure(list(coolfactor_score = list(structure(c(0.164477631065473, 0.198253819406019, 0.396414447052519, 0.133118603987442, 0.107735498488546 ), .Names = c("B", "Mac", "NK", "Neu", "Stro")),...
1757 просмотров
schedule 23.02.2024

Преобразуйте все столбцы в символы в data.frame
Рассмотрим data.frame со смесью типов данных. Для странной цели пользователю нужно преобразовать все столбцы в символы. Как это лучше сделать? Попытка решения tidyverse такова: map(mtcars,as.character) %>% map_df(as.list) %>% View()...
45630 просмотров
schedule 04.01.2024

Использование семантики dplyr::select в функции dplyr::mutate
Здесь я пытаюсь ввести семантику dplyr::select() в функцию, предоставляемую dplyr::mutate(). Ниже приведен минимальный пример. dat <- tibble(class = rep(c("A", "B"), each = 10), x = sample(100, 20), y = sample(100,...
415 просмотров
schedule 16.12.2023

Как узнать, находится ли дата в интервале с помощью lubridate?
Если у меня нечеткий интервал: "2010-02-20" %--% "2012-03-15" Как я могу узнать, находится ли дата, скажем "2011-01-12" , в этом диапазоне? Я использую пакеты lubridate и tidyverse.
238 просмотров
schedule 21.11.2022

используйте dplyr mutate () в программировании
Я пытаюсь присвоить переменной имя столбца с помощью функции mutate. df <-data.frame(x = sample(1:100, 50), y = rnorm(50)) new <- function(name){ df%>%mutate(name = ifelse(x <50, "small", "big")) } Когда я бегу new(name...
2146 просмотров
schedule 12.03.2024

Расчет географических расстояний до точек данных с помощью dplyr :: mutate
Я пытаюсь использовать R с пакетами tidyverse , и у меня возникают проблемы с применением функции к моим данным. Мои данные включают координаты широты и долготы, и я хочу рассчитать расстояние от каждого местоположения (строки моего фрейма данных)...
1797 просмотров
schedule 10.06.2024

Среднее значение по строкам для выбранных столбцов в R
Давайте проиллюстрируем проблему на знаменитом наборе данных iris . Мне нужно применить выбранную функцию по строкам, но только к выбранным столбцам. Пример выглядит следующим образом: library(tidyverse) iris %>% mutate_at(.funs = scale,...
3934 просмотров
schedule 21.11.2023

Выберите несколько строк по условию в R
У меня есть следующий фрагмент моего набора данных: extract[989:993, ] # A tibble: 5 x 2 Dates `Rating agency` <dttm> <chr> 1 2014-07-11 NA 2 2014-07-14 NA 3 2014-07-15...
142 просмотров
schedule 24.11.2023

Как экспортировать каждую сгруппированную таблицу в списке таблиц на другую вкладку Excel с помощью ReadXL и Tidyverse
library(dplyr) library(tidyr) library(forcats) library(readxl) Используя набор данных gss_cat из пакета forcats, я создал сгруппированный и обобщенный фрейм данных, а затем разделил данные по семейным и расовым переменным (если есть лучший...
293 просмотров
schedule 14.04.2024

Добавить столбцы значимости на график уклоненных столбцов
У меня есть данные, которые выглядят так: reading condition time <dbl> <chr> <fctr> 1 0.0603376 A 4 2 0.0000000 A 4 3 0.0576497 A 4 4 11.4080000 B 4 5...
707 просмотров
schedule 22.02.2024

Изменение имени наблюдения с помощью dplyr
Предположим, у меня есть этот набор данных: Variable <- c("GDP") Country <- c("Brazil", "Chile") df <- data.frame(Variable, Country) Я хочу изменить ВВП на ВВП "Country_observation", то есть ВВП Бразилии и ВВП Чили. У меня...
2866 просмотров
schedule 27.03.2024

dplyr количество строк в группах после фильтрации
Мне нужно количество и пропорции (всех элементов) каждой группы в кадре данных (после фильтрации). Этот код дает желаемый результат: library(dplyr) df <- data_frame(id = sample(letters[1:3], 100, replace = TRUE), value =...
3269 просмотров
schedule 13.04.2024

Векторизованное преобразование часовых поясов с помощью lubridate
У меня есть фрейм данных со столбцом строк даты и времени: library(tidyverse) library(lubridate) testdf = data_frame( mytz = c('Australia/Sydney', 'Australia/Adelaide', 'Australia/Perth'), mydt = c('2018-01-17T09:15:00',...
590 просмотров
schedule 12.04.2024

Преобразование любой даты месяца в первый день месяца
Как преобразовать любую дату месяца в первый день месяца? Например. "2017-12-08", "2015-09-28" на "2017-12-01" и "2015-09-01"? Единственный способ, которым я думал, - это преобразовать в символ и gsub последние две цифры в «01».
42 просмотров
schedule 11.05.2024

переименование всех столбцов фрейма данных с помощью stringr и dplyr
Я пытаюсь переименовать все столбцы в моем фрейме данных, используя dplyr и stringr , но, похоже, он работает не так, как я хочу. Что мне следует изменить в следующем коде, чтобы получить желаемый результат (как показано в приведенном ниже коде)?...
1750 просмотров
schedule 11.11.2023

Реорганизация кадра данных с несколькими типами заголовков в соответствии с аккуратным подходом в R
У меня есть кадр данных, который выглядит примерно так: Age A1U_sweet A2F_dip A3U_bbq C1U_sweet C2F_dip C3U_bbq Comments 23 1 2 1 NA NA NA Good 54 NA NA NA 4 1...
141 просмотров
schedule 10.10.2022

Соединение фреймов данных в R (отношение 1:n)
У меня есть data.frame df1 df1 <- data.frame(id=1:10) и у меня есть второй data.frame df2 df2 <- data.frame(id=1:100, key=sample(1:10,100,replace=T), var1=sample(c(TRUE, FALSE),100, replace=T), var2=sample(c("X", "Y"),100,...
53 просмотров
schedule 04.11.2023

Как заменить все значения ‹NA› в data.frame с помощью forcats::fct_explicit_na()?
У меня есть фрейм данных с 19 переменными, 17 из которых являются факторами. Некоторые из этих факторов содержат пропущенные значения, закодированные как NA. Я хотел бы перекодировать отсутствующие значения как отдельный уровень фактора «to_impute»,...
2422 просмотров
schedule 07.02.2024