У меня есть некоторая историческая дата торговли в файле csv в формате: unixtime, цена, объем. Я хочу проанализировать эти данные.
Мне удалось сделать это на Python, но это мучительно медленно (мне требуется около 2 дней, чтобы запустить алгоритм для 30-дневного теста данных).
Я пытаюсь сделать это на c/c++ или даже на Java или Scala, но моя главная проблема в том, что у меня нет возможности передискретизировать данные. Мне нужно преобразовать эти данные в формат: дата, время, открытие, максимум, минимум, закрытие, объем с 15-минутными интервалами, но я не могу найти способ сделать это в c/С++
В Python это делает то, что я хочу (использует кадр данных pandas):
def resample_data(raw_data, time_frame):
# resamples the ticker data in ohlc
resampledData = raw_data.copy()
ohlc_dict = {
'open':'first',
'high':'max',
'low':'min',
'close':'last',
'price':'first'
}
resampledData = resampledData.resample(time_frame, how={'price':ohlc_dict, 'amount':'sum'})
resampledData.amount = resampledData['amount']['sum'].fillna(0.0)
resampledData['price']['close'] = resampledData['price']['close'].fillna(method='pad')
resampledData = resampledData.apply(lambda x: x.fillna(resampledData['price']['close']))
return resampledData
Любые идеи (или библиотеки), которые делают это в c/С++/Java/scala?