Вопросы по теме 'tidyverse'
Моделирование временного ряда в dplyr вместо использования цикла for
Так что, хотя lag и lead в dplyr великолепны, я хочу смоделировать временной ряд чего-то вроде роста населения. Мой старый школьный код выглядел бы примерно так:
tdf <- data.frame(time=1:5, pop=50)
for(i in 2:5){
tdf$pop[i] =...
1152 просмотров
schedule
03.04.2024
Неожиданные значения при применении пользовательской функции в dplyr :: mutate
Мои данные выглядят так:
library(tidyverse)
df <- tribble(
~y_val, ~z_val,
2, 4,
5, 3,
8, 2,
1, 1,
9, 3)
У меня есть пользовательская функция fun_b() , которую я хотел бы применить к фрейму данных с помощью...
69 просмотров
schedule
26.11.2022
Как преобразовать список списка в аккуратный тиббл или data.frame в R
У меня есть следующий список:
my_lol <- structure(list(coolfactor_score = list(structure(c(0.164477631065473,
0.198253819406019, 0.396414447052519, 0.133118603987442, 0.107735498488546
), .Names = c("B", "Mac", "NK", "Neu", "Stro")),...
1757 просмотров
schedule
23.02.2024
Преобразуйте все столбцы в символы в data.frame
Рассмотрим data.frame со смесью типов данных.
Для странной цели пользователю нужно преобразовать все столбцы в символы. Как это лучше сделать? Попытка решения tidyverse такова:
map(mtcars,as.character) %>% map_df(as.list) %>% View()...
45630 просмотров
schedule
04.01.2024
Использование семантики dplyr::select в функции dplyr::mutate
Здесь я пытаюсь ввести семантику dplyr::select() в функцию, предоставляемую dplyr::mutate(). Ниже приведен минимальный пример.
dat <- tibble(class = rep(c("A", "B"), each = 10),
x = sample(100, 20),
y = sample(100,...
415 просмотров
schedule
16.12.2023
Как узнать, находится ли дата в интервале с помощью lubridate?
Если у меня нечеткий интервал: "2010-02-20" %--% "2012-03-15" Как я могу узнать, находится ли дата, скажем "2011-01-12" , в этом диапазоне?
Я использую пакеты lubridate и tidyverse.
238 просмотров
schedule
21.11.2022
используйте dplyr mutate () в программировании
Я пытаюсь присвоить переменной имя столбца с помощью функции mutate.
df <-data.frame(x = sample(1:100, 50), y = rnorm(50))
new <- function(name){
df%>%mutate(name = ifelse(x <50, "small", "big"))
}
Когда я бегу
new(name...
2146 просмотров
schedule
12.03.2024
Расчет географических расстояний до точек данных с помощью dplyr :: mutate
Я пытаюсь использовать R с пакетами tidyverse , и у меня возникают проблемы с применением функции к моим данным. Мои данные включают координаты широты и долготы, и я хочу рассчитать расстояние от каждого местоположения (строки моего фрейма данных)...
1797 просмотров
schedule
10.06.2024
Среднее значение по строкам для выбранных столбцов в R
Давайте проиллюстрируем проблему на знаменитом наборе данных iris . Мне нужно применить выбранную функцию по строкам, но только к выбранным столбцам. Пример выглядит следующим образом:
library(tidyverse)
iris %>%
mutate_at(.funs = scale,...
3934 просмотров
schedule
21.11.2023
Выберите несколько строк по условию в R
У меня есть следующий фрагмент моего набора данных:
extract[989:993, ]
# A tibble: 5 x 2
Dates `Rating agency`
<dttm> <chr>
1 2014-07-11 NA
2 2014-07-14 NA
3 2014-07-15...
142 просмотров
schedule
24.11.2023
Как экспортировать каждую сгруппированную таблицу в списке таблиц на другую вкладку Excel с помощью ReadXL и Tidyverse
library(dplyr)
library(tidyr)
library(forcats)
library(readxl)
Используя набор данных gss_cat из пакета forcats, я создал сгруппированный и обобщенный фрейм данных, а затем разделил данные по семейным и расовым переменным (если есть лучший...
293 просмотров
schedule
14.04.2024
Добавить столбцы значимости на график уклоненных столбцов
У меня есть данные, которые выглядят так:
reading condition time
<dbl> <chr> <fctr>
1 0.0603376 A 4
2 0.0000000 A 4
3 0.0576497 A 4
4 11.4080000 B 4
5...
707 просмотров
schedule
22.02.2024
Изменение имени наблюдения с помощью dplyr
Предположим, у меня есть этот набор данных:
Variable <- c("GDP")
Country <- c("Brazil", "Chile")
df <- data.frame(Variable, Country)
Я хочу изменить ВВП на ВВП "Country_observation", то есть ВВП Бразилии и ВВП Чили.
У меня...
2866 просмотров
schedule
27.03.2024
dplyr количество строк в группах после фильтрации
Мне нужно количество и пропорции (всех элементов) каждой группы в кадре данных (после фильтрации). Этот код дает желаемый результат:
library(dplyr)
df <- data_frame(id = sample(letters[1:3], 100, replace = TRUE),
value =...
3269 просмотров
schedule
13.04.2024
Векторизованное преобразование часовых поясов с помощью lubridate
У меня есть фрейм данных со столбцом строк даты и времени:
library(tidyverse)
library(lubridate)
testdf = data_frame(
mytz = c('Australia/Sydney', 'Australia/Adelaide', 'Australia/Perth'),
mydt = c('2018-01-17T09:15:00',...
590 просмотров
schedule
12.04.2024
Преобразование любой даты месяца в первый день месяца
Как преобразовать любую дату месяца в первый день месяца?
Например. "2017-12-08", "2015-09-28" на "2017-12-01" и "2015-09-01"?
Единственный способ, которым я думал, - это преобразовать в символ и gsub последние две цифры в «01».
42 просмотров
schedule
11.05.2024
переименование всех столбцов фрейма данных с помощью stringr и dplyr
Я пытаюсь переименовать все столбцы в моем фрейме данных, используя dplyr и stringr , но, похоже, он работает не так, как я хочу. Что мне следует изменить в следующем коде, чтобы получить желаемый результат (как показано в приведенном ниже коде)?...
1750 просмотров
schedule
11.11.2023
Реорганизация кадра данных с несколькими типами заголовков в соответствии с аккуратным подходом в R
У меня есть кадр данных, который выглядит примерно так:
Age A1U_sweet A2F_dip A3U_bbq C1U_sweet C2F_dip C3U_bbq Comments
23 1 2 1 NA NA NA Good
54 NA NA NA 4 1...
141 просмотров
schedule
10.10.2022
Соединение фреймов данных в R (отношение 1:n)
У меня есть data.frame df1
df1 <- data.frame(id=1:10)
и у меня есть второй data.frame df2
df2 <- data.frame(id=1:100, key=sample(1:10,100,replace=T), var1=sample(c(TRUE, FALSE),100, replace=T), var2=sample(c("X", "Y"),100,...
53 просмотров
schedule
04.11.2023
Как заменить все значения ‹NA› в data.frame с помощью forcats::fct_explicit_na()?
У меня есть фрейм данных с 19 переменными, 17 из которых являются факторами. Некоторые из этих факторов содержат пропущенные значения, закодированные как NA. Я хотел бы перекодировать отсутствующие значения как отдельный уровень фактора «to_impute»,...
2422 просмотров
schedule
07.02.2024