На самом деле я спрашиваю себя о производительности использования Spark SQL с Hive для аналитики в реальном времени. Я знаю, что Hive был создан для пакетной обработки, а Spark используется для выполнения быстрых запросов.
Но использование Spark SQL с Hive позволит мне выполнять запросы в реальном времени? Или он просто будет делать самые быстрые запросы, но не в режиме реального времени. Должен ли я использовать другое хранилище данных вместо Hive, например Hbase?
Заранее спасибо, Флориан