1) В кубернетах многие компоненты (то есть узлы) имеют метаданные, которые вы хотите просматривать по группам. Примеры:
- контролировать использование ЦП
- отслеживать использование ЦП на всех машинах с графическими процессорами
- контролировать использование памяти
- отслеживать использование памяти на всех машинах (кубеле), которые помечены определенной зоной (например, "ASIA-EAST-1")
И т.д.
В любом из этих случаев, поскольку метрики не отправляются с метками для всех этих данных.
Одно решение: множество мастеров Прометея
Пока что я придумал одно решение: отдельный мастер Prometheus для разных логических групп узлов. Это позволит администратору создавать мастера, которые собирают метрики по произвольной метке, т. Е.
- кластер запросов для всех узлов с меткой = SSD = 16 ГБ,
- создать CSV из этого списка,
- использовать его как конечные точки для мастера Прометея,
- использовать это как конкретный источник данных ".
2) Есть ли более элегантные решения этой проблемы?
Вышеупомянутое решение напугано ужасом - вы делаете много работы только для того, чтобы «взломать» концепцию графаны «источник данных», чтобы повысить уровень ваших показателей.
3) Еще несколько безумных идей ... просто для того, чтобы способствовать более широкому разговору о том, как хосты сегментировать метрики в кубернетах ...
- Может быть, графана достаточно умен, чтобы как-то добавлять свои группы?
- Или может быть расширена графана для выполнения опроса / накопления основного сервера Prometheus?