Я хотел бы запустить список сгенерированных запросов HIVE. Для каждого я хотел бы получить MR job_id (или идентификаторы, в случае нескольких этапов). А затем, с этим job_id, собрать статистику из трекера заданий (кумулятивный ЦП, прочитанные байты...)
Как я могу отправлять запросы HIVE из сценария bash или python и получать идентификаторы job_id?
Для второй части (сбор статистики по заданию) мы используем кластер Hadoop MRv1, поэтому у меня нет REST API AppMaster. Я собираюсь собрать данные из веб-интерфейса Jobtracker. Любая лучшая идея?