Просто прочитал более подробную информацию о storm и наткнулся на его способность группировать поля, например, если вы подсчитываете твиты для каждого пользователя и у вас есть две задачи с группировкой полей идентификатора пользователя, одни и те же идентификаторы пользователей будут отправлены в одни и те же задачи. .
Таким образом, задача 1 может иметь следующие значения в памяти bob: 10 alice: 5
задача 2 может иметь следующие значения в памяти jill:10 joe: 4
Если я добавлю новую машину в кластер для увеличения емкости и запущу перебалансировку, что произойдет с моими счетчиками в памяти? Вы начнете получать пользователей с разным количеством?