HIVE LLAP не работает со сложными типами

Я включил LLAP в песочнице Ambari, и мои запросы больше не работают.

У меня есть таблица с примитивными типами и сложными типами (структуры/массивы).

Я запрашиваю примитивный тип, и он выдает ошибку.

выберите * из test.data, где номер политики = '4'

Ошибка: java.sql.SQLException: ошибка при обработке инструкции: FAILED: ошибка выполнения, код возврата 1 из org.apache.hadoop.hive.ql.exec.tez.TezTask

hadoop hive ambari

thanh nguyen 01.06.2017 источник

comment

LLAP имеет ряд ограничений, см. > stackoverflow.com/questions/43771050/ например. Для начала, вы проверили журналы YARN для вашего запроса?? - Samson Scharfrichter 01.06.2017

comment

Я еще совсем нуб. Я постараюсь просмотреть журналы пряжи и посмотреть, даст ли это какие-либо подробности. Я знаю, что у него есть ограничения, но я подумал, что предложение where для примитивного типа помогло бы. - thanh nguyen 03.06.2017

comment

Моя главная проблема сейчас заключается в том, насколько медленно он находит уникальную запись при поиске по столбцу примитивного типа, поэтому я попытался использовать llap. До llap агрегация — это здорово, но поиск по какому-то уникальному ключу ужасно медленный. Tez, orc, столбцы с примитивной сортировкой для предиката, также имеют столбцы сложного типа. 9 миллионов записей. С llap поиск вообще не будет работать - thanh nguyen 03.06.2017

comment

Похоже, вы приехали с другой планеты и никогда ничего не читали об экосистеме Hadoop... Hive был разработан для МАССИВНЫХ ЗАПРОСОВ ПОЛНОГО СКАНИРОВАНИЯ огромных неизменяемых файлов данных. Столбчатые форматы файлов, такие как ORC и Parquet, позволяют пропустить сканирование (вместо полного сканирования). Формат файла CarbonData обещает инвертированный индекс, но он все еще экспериментальный и еще не интегрирован в Hive. С другой стороны, вы можете использовать HBase для доступа к ключу/значению. И вы можете использовать SolR или ElasticSearch для полнотекстового поиска. Но это разные инструменты, для разных целей и с разным дизайном. - Samson Scharfrichter 03.06.2017

comment

Итог: если вы хотите выполнять OLTP-запросы к индексированным таблицам, просто используйте MySQL на своем ноутбуке. Или даже небольшую базу данных, такую как H2 или SQLite. Сегодня 9 миллионов записей оцениваются как небольшие данные, которые, вероятно, будут работать на вашем смартфоне... - Samson Scharfrichter 03.06.2017

comment

Причина, по которой я выбрал Hadoop, заключалась прежде всего в том, что поступающие данные представляли собой большие блоки XML с кучей вложенных объектов, которые я не хотел встраивать в таблицы. - thanh nguyen 04.06.2017

comment

Можете ли вы помочь мне понять, почему тогда ORC медленный, без llap, и не может использоваться с llap, когда другие столбцы являются большими двоичными объектами, а условие where относится к примитивному типу? Я пытаюсь настроить эту систему, чтобы другие могли использовать SQL. - thanh nguyen 04.06.2017

comment

И да, я настоящий нуб. Я разработчик .net, пытающийся сделать так, чтобы весь этот XML, который был таким медленным для запросов, был быстрым для запросов. - thanh nguyen 04.06.2017

HIVE LLAP не работает со сложными типами

Похожие вопросы