Я сохраняю исторические данные временных рядов в Cassandra.
cassandra@cqlsh>CREATE TABLE data."InstrumentTimeSeries" (
key blob,
column1 bigint,
value blob,
PRIMARY KEY (key, column1)
) WITH COMPACT STORAGE
AND bloom_filter_fp_chance = 0.01
AND comment = ''
AND dclocal_read_repair_chance = 0.0
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99.0PERCENTILE'
AND caching = {
'keys' : 'ALL',
'rows_per_partition' : 'NONE'
}
AND compression = {
'sstable_compression' : ''
}
AND compaction = {
'class' : 'SizeTieredCompactionStrategy'
};
В столбце «значение» я сохраняю весь json после его сериализации. Теперь я хочу получить записи на основе некоторых ключей из json, хранящихся в столбце значений.
- Я могу создать дублирующую таблицу, добавив новые столбцы кластеризации в соответствии с требованиями. или же
- Я могу думать о вторичном ИНДЕКСЕ
У меня более 20 миллионов записей в таблице.
Как лучше всего это сделать?