Вопросы по теме 'hadoop-partitioning'

Как разделить большую таблицу Hive на множество категорий
Я хочу разделить свою таблицу в улье, чтобы для каждого уникального элемента в строке он создавал раздел. Существует ~ 250 разделов для таблицы с 4 миллиардами строк, поэтому я хотел бы создать что-то вроде цикла for или отдельного. Вот мои мысли в...
3915 просмотров
schedule 06.02.2024

FAILED: ParseException: невозможно распознать ввод рядом с «exchange» «string» «,» в спецификации столбца
Я использую последнюю версию AWS Hive 0.13.0 . FAILED: ParseException: cannot recognize input near 'exchange' 'string' ',' in column specification Я получаю указанную выше ошибку, когда запускаю запрос ниже (создание таблицы). CREATE...
13199 просмотров

HIVE: создание пустых корзин после разбиения на разделы в HDFS
Я пытался создать разделы и ведра с помощью HIVE. Для настройки некоторых свойств: set hive.enforce.bucketing = true; SET hive.exec.dynamic.partition = true; SET hive.exec.dynamic.partition.mode = nonstrict; Ниже приведен код для создания...
747 просмотров
schedule 25.05.2024

Вставить секционированные данные в секционированную таблицу кустов
Я сохранил данные в hdfs, используя Pig Multistorage с идентификатором столбца. Итак, данные хранятся как /output/1/part-0000 /output/2/ /output/3/ Теперь я создал секционированную таблицу в улье и хочу загрузить данные из папки / output в...
1409 просмотров

Функция MAX(Count) apache pig Latin
В приведенной ниже программе я пытаюсь сделать это в Apache Pig как есть и с неструктурированными данными. i) У меня есть набор данных, который содержит название улицы, город и штат: ii) Группировка по штатам iii) Я беру COUNT(*) состояний в...
330 просмотров