Как я могу использовать зоопарк пакетов R или xts с очень большими наборами данных? (100 ГБ) Я знаю, что есть некоторые пакеты, такие как bigrf, ff, bigmemory, которые могут решить эту проблему, но вы должны использовать их ограниченный набор команд, у них нет функций зоопарка или xts, и я не знаю как сделать зоопарк или xts для их использования. Как я могу его использовать?
Я видел, что есть и некоторые другие вещи, связанные с базами данных, такие как sqldf и hadoopstreaming, RHadoop или что-то другое, используемое Revolution R. Что вы посоветуете? Любое другое?
Я просто хочу агрегировать ряды, очистить и выполнить некоторые коинтеграции и графики. Мне бы не хотелось кодировать и реализовывать новые функции для каждой команды, которая мне нужна, каждый раз используя небольшие фрагменты данных.
Добавлено: я на Windows
mmap
, созданный Джеффом Райаном (автором xts) - person CHP   schedule 27.03.2013mmap
для unix-подобных файлов иMapViewOfFile
для Windows. Вам не нужно знать ничего из этого, чтобы использовать пакет, поэтому я спросил, действительно ли вы смотрели (т.е. пробовали) пакет. Есть виньетка с примерами, и у Джеффа есть несколько презентаций, гуляющих по сети. - person Joshua Ulrich   schedule 02.04.2013