Apache Flink, работа с большой охотой - время ожидания для кластера истекло

Мы пытаемся построить Flink Job для агрегирования цен с довольно сложной логикой.

Например. в предыдущей версии был график, как показано ниже.

После очередной итерации разработки я добавил к работе еще больше сложности. Новая версия отлично работала в среде IDE, однако развертывание в кластере завершилось ошибкой с

Вызвано: org.apache.flink.runtime.client.JobClientActorSubmissionTimeoutException: время отправки задания в JobManager истекло.

Если я перенастрою задание (уменьшу сложность графа), оно будет развернуто без каких-либо проблем.

Мои вопросы:

  1. Существуют ли какие-либо ограничения на размер и сложность графика заданий при отправке в автономный кластер?
  2. Есть ли возможность отключить графическое представление графа (у меня есть подозрения, что проблема вызвана графическим представлением - локально моя работа работает)
  3. Существуют ли какие-либо инструменты отладки, чтобы понять, что происходит при отправке задания и почему время ожидания истекает?

Заранее спасибо.

введите описание изображения здесь


person Igor Piddubnyi    schedule 27.06.2018    source источник
comment
Какую версию Flink вы используете? Эта проблема сохраняется с Flink 1.5? Если да, не могли бы вы поделиться с нами журналами cli и cluster?   -  person Till Rohrmann    schedule 29.06.2018
comment
@TillRohtmann Мы использовали flink 1.4.1, но обновление до 1.5 решило проблему.   -  person Igor Piddubnyi    schedule 01.07.2018


Ответы (1)


Решением было использовать последнюю версию флинка (на момент написания 1.5).

person Igor Piddubnyi    schedule 01.07.2018