В настоящее время я разрабатываю модуль быстрой агрегации данных, который получает события и публикует их в кластере Kafka. Затем у нас есть интеграция Kafka и Spark Streaming. Spark Streaming считывает поток из Kafka и выполняет некоторые вычисления. Когда вычисление завершено, нам нужно отправить результат в другое приложение. Это приложение может быть веб-службой или кластером Kafka.
Мне интересно, как мы можем это сделать? Из того, что я читал, Spark Stream отправляет данные в нисходящие потоки, такие как базы данных и файловые системы.
Как бы вы поступили с дизайном такого приложения? Должен ли я заменить Spark Stream на Storm, чтобы иметь возможность публиковать результаты в другом приложении?