Вопросы по теме 'cloudera-cdh'

Настройте формат вывода Sqoop2 TEXT_FILE
Я использую Sqoop2 (Sqoop 1.99.3-cdh5.1.0) для импорта данных из базы данных postgresql. Задание успешно завершается и создает текстовые файлы в HDFS. Выходные файлы представляют собой CSV с одинарными кавычками, я хотел бы настроить вывод так,...
503 просмотров
schedule 07.11.2022

Определение слота уменьшения карты
Я на пути к тому, чтобы стать администратором Cloudera Hadoop. С самого начала я много слышал о вычислительных слотах для каждой машины в кластере Hadoop, например, об определении количества слотов карт и уменьшении слотов. Я искал в Интернете...
6447 просмотров

Ошибка балансировщика CDH5 hdfs
при запуске «балансировщика hdfs», я вижу, что он показывает установленную топологию стойки, чрезмерно используемые и недостаточно используемые узлы, он говорит: «Необходимо переместить 5 ТБ, чтобы сделать кластер сбалансированным» и «Решено...
2100 просмотров
schedule 30.11.2023

Трекер вакансий не запускается
Я устанавливаю CDH4.6.0 с помощью jps Namenode Datanode Secondary Namenode Tasktracker 2.html. " rel="nofollow">этот сайт Я запускаю start-all.sh для запуска служб. /etc/init.d/hadoop-hdfs-namenode start...
1428 просмотров
schedule 25.03.2024

Как проверить версию Spark
как указано, как узнать, какая версия spark была установлена ​​​​в CentOS? В текущей системе установлен cdh5.1.0.
111405 просмотров
schedule 07.11.2023

PIG: столбцы в строки
У меня есть файл, содержащий это: id_v^id_f^id_s1,id_s2,id_s3,id_s4 id_v1^id_f1^id_s2,id_s3,id_s4 id_v2^id_f2^id_s2,id_s1,id_s4 этот файл представляет собой CSV-файл с разделителями "^". я хочу нормализовать его таким образом, используя...
49 просмотров
schedule 22.02.2024

Основной класс [org.apache.oozie.action.hadoop.SqoopMain], код выхода [1]
когда я пытаюсь запустить рабочий процесс sqoop в cloudera CDH-5.3, он дает следующую ошибку Основной класс [org.apache.oozie.action.hadoop.SqoopMain], код выхода [1] Я пытаюсь вставить данные в hdfs из базы данных Mysql. Я скопировал...
1215 просмотров
schedule 30.10.2023

Убедитесь, что моментальный снимок HBase захватил все данные
При создании моментальных снимков в HBase я получил сообщение об ошибке «Снимок «имя_снимка» не был завершен в ожидаемое время: 60000 мс. Однако, когда я затем перечисляю свои текущие снимки, я вижу, что снимок, который вернул ошибку, говорящую о...
914 просмотров
schedule 07.11.2023

Как использовать регулярное выражение в OOZIE?
Я хочу проверить, существует ли файл в указанном месте HDFS. Мы можем проверить, существует файл или нет в заданном месте HDFS с помощью fs:exists, т.е. Если имя файла test_25082016 , с помощью задания согласования мы можем получить значение...
817 просмотров

Запустите Spark Job через Uber Jar с Oozie и Hue
В настоящее время я изучаю, как использовать Apache Oozie для запуска заданий Spark в CDH 5.8, но, похоже, обнаружил проблемы. Я компилирую свою искровую работу с помощью IntelliJ> Build Artifact (в Uber JAR / Fat JAR), а затем удаляю его файл...
1481 просмотров
schedule 09.03.2024

Как координатор Oozie реагирует на базовое изменение рабочего процесса?
У меня есть вопрос об Apache Oozie и, в частности, о дистрибутиве CDH. Что происходит с координатором, когда используемый им рабочий процесс был изменен? Например, рабочий процесс теперь использует дополнительный параметр, который автоматически...
1019 просмотров

Oozie's Spark Submit использует метод ivy 2.4, отсутствующий в CDH 5.9.2.
Средство запуска рабочего процесса oozie иногда дает сбой (статус KILLED) из-за порядка загрузки пути к классам. В SparkSubmit существует вызов метода в ivy 2.4.0, но этого конкретного метода нет в ivy 2.0.0-rc2. Рабочий процесс обычно проходит...
435 просмотров
schedule 13.03.2024

Обновление отдельных компонентов CDH в Community Edition с помощью «Установщика в один клик»
Может ли кто-нибудь сообщить мне, возможно ли обновить отдельный компонент CDH до версии 5.13 с версии 5.7 с помощью «1 Click Installer» для Community Edition? Например, допустим, я хочу обновить только hadoop-hdfs-datanode до последней версии на...
51 просмотров
schedule 07.12.2023

Могу ли я установить второй Hadoop с CDH, если я уже установил Hadoop с Ambari? На тех же машинах
Могу ли я иметь второй кластер Hadoop с CDH, если у меня уже установлен кластер Hadoop с Ambari на тех же трех машинах? Если да, как я могу перенести данные из исходного кластера в новый кластер? Спасибо.
93 просмотров
schedule 24.05.2024

Разница между двумя отметками времени в Hive через запрос
У меня есть таблица кустов со следующими столбцами session Timestamp 1 2018-05-18T00:00:00.000Z 1 2018-05-18T00:01:00.000Z 1 2018-05-18T00:02:00.000Z 1 2018-05-18T00:03:00.000Z 2...
5065 просмотров
schedule 01.04.2024

подключение PBI к импале
Я создал кластер cloudera (ENTERPRISE DATA HUB) на Azure. Я могу использовать DNSname:7180 для просмотра и управления кластером. Однако мне не удалось подключиться к Impala из PowerBI Desktop. Я попробовал оба имени виртуальных машин с расширением...
540 просмотров
schedule 02.03.2024