У меня возникла дилемма относительно опроса/хранения лог-файлов.
Дело в том, что нам нужно отслеживать наши логи из Cloudhub, агрегировать их с помощью Logstash и хранить (вероятно, с помощью ElasticSearch).
Anypoint Runtime Manager, по-видимому, поддерживает отправку событий в сторонние системы только в помещении (не из облака), поэтому я решил сделать демонстрацию для опроса журналов через REST API с помощью плагина logstash http-poller.
Я принимаю некоторые решения, с которыми у меня мало опыта.
При опросе вы всегда будете получать последние x журналов за определенный интервал времени. Я предполагаю, что эти параметры будут зависеть от типа логов, но мне все же интересно, на каком уровне вы будете заниматься дублированием извлеченных логов. И как вы справляетесь с неопределенностью пропуска журналов.
Это то, что вы будете обрабатывать на уровне хранилища, или это то, что вы будете обрабатывать сразу на logstash?
Спасибо, что поделились своими мыслями по этому вопросу.