Мы запускаем приложение для потоковой передачи в реальном времени на Hortonworks, используя Kafka и Spark Streaming в локальной настройке кластера.
У нас есть требование, когда нам нужно передать некоторые данные, инициированные событием, из Spark Streaming или Kafka, чтобы сохранить их в файловой системе S3 AWS.
Любые указатели вокруг этого будут оценены.