Вопросы по теме 'apache-storm'

Эластичная топология Storm / сосуществование Storm и Hadoop
Мы оцениваем возможность развертывания преследования Storm, но меня это немного беспокоит. В настоящее время мы запускаем Hadoop MapReduce и хотели бы перенести часть нашей обработки с процессов MapReduce на процессы Storm. Обратите внимание, что...
2567 просмотров

Storm: можно установить topology.message.timeout.secs намного выше для одного болта.
Часть моей топологии зависит от работы со сторонним API, который ограничивает скорость определенных вызовов в 15-минутных окнах. В худшем случае ограничение скорости сработает, и болту нужно будет заснуть на 15 минут. К сожалению, похоже, что я не...
3457 просмотров
schedule 07.01.2024

Как Storm обрабатывает группировку полей при добавлении дополнительных узлов?
Просто прочитал более подробную информацию о storm и наткнулся на его способность группировать поля, например, если вы подсчитываете твиты для каждого пользователя и у вас есть две задачи с группировкой полей идентификатора пользователя, одни и те же...
4798 просмотров
schedule 17.12.2023

При запуске топологии в storm мы получаем такую ​​ошибку
При запуске топологии в storm мы получаем такую ​​ошибку, 8983 [Thread-6] INFO com.netflix.curator.framework.imps.CuratorFrameworkImpl - Starting 9144 [main] INFO **backtype.storm.daemon.nimbus** - Shutting down master 9199...
951 просмотров
schedule 17.11.2022

Как я могу профилировать топологии Apache Storm без использования веб-панели?
Название в значительной степени говорит само за себя, у меня есть несколько топологий Storm, и я хотел бы измерить их задержки, то есть количество времени между сообщением, поступающим от Kafka, и последним битом связанного выполнения в финальном...
1917 просмотров
schedule 08.05.2024

использование Apache AsyncHttpClient в штормовом болте
У меня есть болт, который делает вызов API (HTTP Get) для каждого кортежа. чтобы избежать необходимости ждать ответа, я хотел использовать apache HttpAsyncClient. после создания экземпляра клиента в методе подготовки болта метод execute создает...
3177 просмотров
schedule 21.09.2022

как я могу получить источник данных болта?
Я новичок в штормовой среде, и у меня есть вопрос! У меня есть 2 носика (spoutA и spoutB), которые передают данные болту (bolt1). Я определил этот болт следующим образом: builder.setBolt("bolt1",...
76 просмотров
schedule 10.04.2024

Параллельная обработка XML-дампа данных Википедии с помощью Storm
Я пытаюсь обработать дамп википедии, найденный здесь . Конкретно с файлом enwiki-latest-pages-articles-multistream.xml.bz2. Это около 46 ГБ без сжатия. В настоящее время я использую анализатор STAX на Java (xerces) и могу извлекать 15 000...
653 просмотров
schedule 29.11.2022

На каждую машину в грозовом кластере назначать строго по одному спецболту
Я хотел бы запустить специальный болт на каждой машине в моем кластере. У Storm есть подключаемый планировщик, но документации очень мало. Есть только один понятный пример из Сюминмин. Как можно реализовать этот шаблон с помощью IScheduler ?...
194 просмотров
schedule 17.02.2024

Как создать единый JAR-файл для исходного кода, охватывающий несколько проектов в Eclipse, и еще один JAR-файл только с зависимостями, используя Maven
Я пытаюсь создать один JAR из нескольких проектов в eclipse с помощью Maven. Мое требование - создать два JAR, 1. один JAR с исходным кодом для всех проектов 2. один JAR со всеми зависимостями без исходного кода. Я развертываю это в кластере...
51 просмотров

Apache Storm — использовать несколько носиков?
Итак, я пытаюсь настроить носик для чтения из очереди Amazon SQS. Теперь мне нужна ситуация, в которой я могу распределить нагрузку между несколькими носиками. Я понимаю, что возможно иметь несколько потоков, но могу ли я иметь два или более...
2741 просмотров
schedule 08.01.2024

Формат потока Apache Storm
Я новичок в Apache Storm, но, конечно, знаю, что цель — обработка потоковых данных. Мой вопрос: каковы требования к «потоку», чтобы он мог обрабатываться Storm с помощью ростка? В моем случае у меня есть приложение, написанное на C++, которое я хочу...
93 просмотров
schedule 27.05.2024

Может ли кто-нибудь предложить мне, как я могу протестировать или сравнить Apache Storm?
Мне нужно проверить производительность apache storm, установленного в кластере с несколькими узлами. Мне нужен совет, как я могу это сделать? Какие аспекты нам необходимо учитывать? есть ли какие-либо инструменты, доступные в документации? Я...
501 просмотров

как использовать apache storm для поиска последовательных временных рядов по данным датчиков?
Мы используем Apache Storm для предварительной обработки некоторых данных датчиков. Данные примерно такие. Одним из наших требований является обнаружение последовательных временных рядов. например, у нас есть 4 данных, T1,T2,T3,T4, где T4-T3...
400 просмотров
schedule 24.09.2022

Storm: ошибка при инициализации сервера mk-supervisor — обязательное поле «serialized_parts» не задано.
Я попытался установить последнюю версию storm, storm 0.10.beta1 apache-storm-0.10.0-beta1.tar.gz И используйте следующий скрипт supervisord для запуска супервизора, но я получил TProtocolException: Required field 'serialized_parts' is unset...
1322 просмотров
schedule 05.11.2022

как определить, все ли выбросы достигли болта?
У меня есть носик kafka, скажем, KafkaSpout , который читает сообщение, скажем, msg из темы kafka, и отправляет болт, скажем, Bolt1 . Bolt1 разделяет это сообщение на несколько сообщений msg1 , msg2 ,.., msgN и отправляет другому Bolt, скажем...
125 просмотров
schedule 10.12.2022

Не удалось отправить топологию шторма
Я пытаюсь отправить топологию Storm на удаленный хост с помощью Eclipse. Вот мой код: Config conf = new Config(); conf.setDebug(false); conf.setNumWorkers(1); conf.put(Config.NIMBUS_HOST, "hostName"); conf.put(Config.NIMBUS_THRIFT_PORT,6627);...
1207 просмотров
schedule 31.03.2024

Как сохранить значения из Trident/Storm в списке (используя Java API)
Я пытаюсь создать несколько модульных тестов, чтобы убедиться, что определенные части моей топологии Trident делают то, что должны. Я хотел бы получить все значения, полученные после запуска топологии, и поместить их в список, чтобы я мог "видеть"...
268 просмотров
schedule 11.10.2022

Публикация результата Apache Spark в другом приложении/Кафке
В настоящее время я разрабатываю модуль быстрой агрегации данных, который получает события и публикует их в кластере Kafka. Затем у нас есть интеграция Kafka и Spark Streaming. Spark Streaming считывает поток из Kafka и выполняет некоторые...
785 просмотров

Какой надзиратель будет слушать через носик?
В моей топологии у меня есть носик с открытым сокетом на порту 5555 для приема сообщений. Если в моем кластере Storm есть 10 супервизоров, будет ли каждый из них прослушивать свои порты 5555? В конце концов, какому руководителю я должен...
52 просмотров
schedule 07.06.2024