В cassandra данные назначаются заданному узлу с помощью ключа раздела, а затем сохраняются на диске отсортированными на основе ключа кластеризации в разделе.
«Коэффициент распределения» позволяет определить:
1) Сколько строк инструмент стресса создаст в каждом разделе,
2) Сколько строк будет считывать инструмент стресса из каждого раздела (они будут упорядочены, поэтому достаточно быстро получить более одной)
В случае FIXED() это означает, что каждый раздел будет иметь ФИКСИРОВАННОЕ количество строк — если вы выберете некоторые другие параметры, вы получите переменное количество строк.
Изменить, чтобы объяснить несколько строк в разделе:
Например, если у вас есть модель данных, в которой вы собираете информацию о погоде из разных городов:
CREATE TABLE sensor_readings (
station_id text,
weather_time timestamp,
temperature int,
humidity int,
PRIMARY KEY(station_id, weather_time));
В этом случае у вас есть несколько строк (по одной для каждого Weather_Time) в каждом разделе (station_id). Вы можете запросить все показания датчика в заданном station_id, или вы можете запросить только одно конкретное Weather_Time. Коэффициент распределения определяет, сколько weather_time
у вас есть на station_id
.
person
Jeff Jirsa
schedule
21.01.2016