Вопросы по теме 'hadoop-partitioning'
Как разделить большую таблицу Hive на множество категорий
Я хочу разделить свою таблицу в улье, чтобы для каждого уникального элемента в строке он создавал раздел. Существует ~ 250 разделов для таблицы с 4 миллиардами строк, поэтому я хотел бы создать что-то вроде цикла for или отдельного. Вот мои мысли в...
3915 просмотров
schedule
06.02.2024
FAILED: ParseException: невозможно распознать ввод рядом с «exchange» «string» «,» в спецификации столбца
Я использую последнюю версию AWS Hive 0.13.0 .
FAILED: ParseException: cannot recognize input near 'exchange' 'string' ',' in column specification
Я получаю указанную выше ошибку, когда запускаю запрос ниже (создание таблицы).
CREATE...
13199 просмотров
schedule
24.03.2024
HIVE: создание пустых корзин после разбиения на разделы в HDFS
Я пытался создать разделы и ведра с помощью HIVE.
Для настройки некоторых свойств:
set hive.enforce.bucketing = true;
SET hive.exec.dynamic.partition = true;
SET hive.exec.dynamic.partition.mode = nonstrict;
Ниже приведен код для создания...
747 просмотров
schedule
25.05.2024
Вставить секционированные данные в секционированную таблицу кустов
Я сохранил данные в hdfs, используя Pig Multistorage с идентификатором столбца.
Итак, данные хранятся как
/output/1/part-0000
/output/2/
/output/3/
Теперь я создал секционированную таблицу в улье и хочу загрузить данные из папки / output в...
1409 просмотров
schedule
28.11.2022
Функция MAX(Count) apache pig Latin
В приведенной ниже программе я пытаюсь сделать это в Apache Pig как есть и с неструктурированными данными.
i) У меня есть набор данных, который содержит название улицы, город и штат:
ii) Группировка по штатам
iii) Я беру COUNT(*) состояний в...
330 просмотров
schedule
30.01.2024