Вопросы по теме 'data.table'

Перенос операций набора из фреймов данных R в таблицы данных: как идентифицировать повторяющиеся строки?
[Обновление 1: как заметил Мэтью Доул, я использую data.table версию 1.6.7 на R-Forge, а не на CRAN. Вы не увидите такого же поведения с более ранней версией data.table .] В качестве фона: я переношу некоторые небольшие служебные функции для...
971 просмотров
schedule 20.10.2022

Как сопоставить два data.frames с неточным совпадающим идентификатором (один идентификатор должен быть в диапазоне другого)
У меня есть следующая проблема сопоставления: у меня есть два data.frames, один с наблюдением каждый месяц (для идентификатора компании) и один с наблюдением каждый квартал (для идентификатора компании; обратите внимание, что квартал означает...
1168 просмотров
schedule 19.02.2024

окно (также известное как вращение) объединяется с data.table
Я пытаюсь найти способ обойти эту функцию запроса: [# 2300] Добавьте backwards и firstback к roll = TRUE , который был упомянут в этот пост . В основном я хотел бы выполнить следующее "оконное соединение" X поиска в Y левое соединение...
672 просмотров
schedule 15.09.2022

Обновить подмножество data.table на основе соединения
У меня есть две таблицы данных, DT1 и DT2: set.seed(1) DT1<-data.table(id1=rep(1:3,2),id2=sample(letters,6), v1=rnorm(6), key="id2") DT1 ## id1 id2 v1 ## 1: 2 e 0.7383247 ## 2: 1 g 1.5952808 ## 3: 2 j 0.3295078 ## 4:...
6917 просмотров

Использование `car` для перекодирования диапазона столбцов
Я копался в Интернете и не могу понять, как применить car для перекодирования значений для диапазона столбцов. Чтобы перекодировать значения для одного столбца, я бы запустил такую ​​команду, как: df$dv_r <- recode(df$dv, "2=1;1=0;0=NA")...
6536 просмотров
schedule 02.03.2024

R data.table segfault при попытке обновить один столбец и создать другой
Можно ли создать новый столбец в таблице данных и одновременно обновить существующий столбец? Следующее не сработало. Спасибо. library(data.table) dt <- data.table(x=runif(4), y=runif(4), z=c("x","x","y","y")) dt[, c("x", "y") := list(x[1],...
306 просмотров
schedule 05.04.2024

Эффективное сопоставление строк по нескольким переменным — исключение столбцов
Я работаю над финансовой проблемой удаления сообщений из финансового центра. Я использую data.table и очень доволен его производительностью и простотой в обращении. Тем не менее, я всегда спрашиваю себя, как улучшить и использовать всю мощь...
130 просмотров
schedule 29.12.2023

Как агрегировать data.frame для имен строк и столбцов на основе иерархической структуры имен словарей?
(извините, я не был уверен, какое название будет лучшим для этого поста, не стесняйтесь редактировать). Допустим, у меня есть следующая реляционная структура между словами и их типом (т.е. словарь): dictionary <-...
1196 просмотров
schedule 16.01.2024

Изменить значения data.table в одном столбце для нескольких строк
Я пытаюсь изменить значения одного столбца для определенных строк в таблице данных. Это работает при векторном сканировании, но не при бинарном поиске. dtData <- data.table(TickerId = c(1,2,3,4,5), DateTime = c(1,2,3,4,5), Close =...
2471 просмотров
schedule 20.09.2022

Подмножество data.table с минимальным условием
Вероятно, существует действительно простое решение этой проблемы, но я не смог найти его ни в гугле, ни в data.table FAQ. У меня есть таблица данных: > test chr bp ID REF ALT AF AC AN...
386 просмотров
schedule 22.05.2024

data.table фильтр вычисляемого столбца
Я пытаюсь вычислить столбец, используя data.table; Целью здесь является вычисление столбца speedup для среды выполнения относительно 1 потока. setup mode name threads runtime 1: A short K 1 10 2: A...
1640 просмотров
schedule 17.12.2023

лучший способ манипулировать строками в больших данных. таблица
У меня есть строка data.table размером 67 мм с именами и фамилиями людей, разделенными пробелами. Мне просто нужно создать новый столбец для каждого слова. Вот небольшое подмножество данных: n <- structure(list(Subscription_Id =...
706 просмотров
schedule 02.01.2024

test_file() работает, но test() не работает с data.table
Мой вопрос похож на r devtools test(), но testthat test_file () работает , однако я не уверен, применим ли и здесь комментарий @hadley. Я создал минимальный рабочий пример пакета R , в котором тестирование отдельного файла с помощью...
588 просмотров
schedule 30.03.2024

R data.table с преобразованием Box Cox из пакета MASS
Я пытаюсь сделать что-то довольно простое. У меня есть таблица данных, созданная следующим образом z = data.table(id = c('a'),x = 1:4,y=c(48,80,44,34)) z id x y 1: a 1 48 2: a 2 80 3: a 3 44 4: a 4 34 Затем я создал функцию, которая...
957 просмотров
schedule 06.11.2022

Ошибка объединения двух таблиц data.tables
Я пытаюсь использовать таблицу данных в качестве таблицы поиска: > (dt <- data.table(myid=rep(11:12,3),zz=1:6,key=c("myid","zz"))) myid zz 1: 11 1 2: 11 3 3: 11 5 4: 12 2 5: 12 4 6: 12 6 > (id2name <-...
163 просмотров
schedule 23.04.2024

Самый быстрый способ извлечь час из времени (ЧЧ:ММ)
Желание fastPOSIXct работает, но не работает в данном случае. Вот мои данные о времени (у которых нет дат) - и мне нужно получить от них часовую часть. times <- c("9:46","11:06", "14:17", "19:53", "0:03", "3:56") Вот неверный вывод из...
7553 просмотров
schedule 02.11.2022

data.table фильтр строк с другой data.table, когда ключи находятся в другом порядке
Я только учусь использовать data.table и столкнулся с неожиданной проблемой. У меня есть большой набор данных all с несколькими индексами, 21 столбцом и ~ 20 тыс. Строк. Я объединяю all , сгруппированные по 2 индексированных столбца, и называю...
1067 просмотров
schedule 26.01.2024

Перенести строки в столбцы и удалить только НП в результирующих столбцах
Я пытаюсь написать код для перехода из входного файла этого типа dput(input) c("A\t8213", "B\tAnytown", "C\tAAA", "D\t19", "E\t19", "F\tAny ID", "G\t0", "H\t0", "I\t0", "J\t0", "K\t0", "L\t0", "M\t0", "N\t0.048", "O\t0.303", "P\t31", "Q\t0",...
308 просмотров
schedule 13.05.2024

Эффективный подсчет или табулирование фактора другими факторами и изменение формы в data.frame?
Я ищу эффективный способ вычисления совокупной суммы (таблицы) всех векторных уровней вектора при использовании data.table. Эта проблема Dataframe/data.table DT изначально состоит из четырех переменных, одна из которых называется experience ....
183 просмотров
schedule 14.12.2023

С data.table вернитесь между определенными символами в новый столбец
У меня такое чувство, что это может быть простой вопрос, но я немного просмотрел SO и нашел много интересных связанных вопросов и ответов, я все еще в тупике. Вот что мне нужно узнать (честно говоря, я играю с набором данных kaggle Titanic, но я...
97 просмотров
schedule 29.01.2024