Мы оцениваем возможность развертывания преследования Storm, но меня это немного беспокоит. В настоящее время мы запускаем Hadoop MapReduce и хотели бы перенести часть нашей обработки с процессов MapReduce на процессы Storm. Обратите внимание, что это некоторые, но не все. У нас по-прежнему будет некоторая функциональность MapReduce.
Я нашел Mesos, который (потенциально) мог бы позволить нам поддерживать развертывание Storm и Hadoop на одном и том же оборудовании, но имел несколько других проблем:
Я представляю себе идеальную ситуацию, когда можно произвольно «занимать» слоты между Storm и Hadoop. бывший. оба будут использовать одни и те же ресурсы по мере необходимости. К сожалению, это фиксированное развертывание, а не «облачное», как EC2 или подобное.
Я хочу избежать узких мест в нашей среде Storm. Идеальным случаем было бы «раскрутить» (или наоборот) больше экземпляров Bolts по мере необходимости. Это возможно / реально?
«Перезапуск» топологии кажется довольно дорогостоящей операцией, и я не уверен, что это действительно вариант. В идеале я бы хотел, чтобы он был максимально бесшовным.
Правильно ли мы подходим к этой проблеме? По сути, топология Storm «подпитывает» пакетное задание MapReduce. Некоторая часть нашей обработки может обрабатываться в потоковом режиме и была бы намного лучше в качестве топологии Storm, в то время как некоторые из них требуют пакетной обработки.
Любые общие отзывы, даже если они не касаются моих конкретных вопросов, приветствуются. На данный момент это скорее исследовательская фаза, и я могу полностью ошибиться.