Вопросы по теме 'hadoop2'

Узел имен Hadoop 2.2 работает, но узел данных не работает
Я впервые устанавливаю hadoop v2.2 из этого руководства ( ссылка ). Мой узел имен работает нормально на http://localhost:50070/ Но мой узел данных не работает : http://localhost:50030/ . Скажите, пожалуйста, нужен ли вам вывод какой-либо...
6703 просмотров
schedule 20.04.2024

Ошибка запуска сервера Hadoop-2.4.0 HBase-0.19.18 Region
Недавно я установил hadoop-2.4.0 и hbase-0.95.18, скомпилированные с помощью sudo mvn clean package assembly:assembly -DskipTests -Dhadoop.profile=2.4 используя приведенные ниже параметры pom.xml....
564 просмотров
schedule 06.10.2022

Ошибка HDFS: «ввод»: нет такого файла или каталога
Я установил hadoop 2.6.0 и играю с ним. Я пробую псевдораспределенную установку и следую инструкциям на http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html#Execution Я застрял на 5-м шаге, т.е. когда я...
22198 просмотров
schedule 24.10.2022

Дамп строки или кортежа (строка, целое число) в pig
У меня есть простой скрипт свиньи, я смог прочитать данные и сбросить данные. Однако мне не удалось вывести строку или кортеж (string, int). Просто интересно, что мне здесь не хватает? Большое спасибо! dataset = LOAD '/Users/me/input' USING...
2594 просмотров
schedule 23.11.2022

Исключение в основном потоке при форматировании namenode в hadoop
satya@ubuntu:~/hadoop/bin$ hadoop namenode -format УСТАРЕЛО: Использование этого скрипта для выполнения команды hdfs устарело. Вместо этого используйте для этого команду hdfs. Exception in thread "main"...
3645 просмотров
schedule 28.01.2024

как контролировать dfs.namenode.handler.count с помощью grafana (opensdb)?
как это? изображение мой вопрос в том, есть ли такая же метрика, как в Red Mashine. как это называется? или если я должен определить метрику? как это сделать? спасибо вам!
486 просмотров
schedule 02.11.2022

Sqoop Неверный URL-адрес подключения SQL Server
Когда я пытаюсь запустить sqoop, я получаю следующую ошибку: java.lang.IllegalArgumentException: Invalid connection URL url jdbc:sqlserver://{host}:{port} Моя команда: sqoop list-databases \ --connect jdbc:sqlserver://{host}:{port}...
301 просмотров
schedule 05.03.2024

Оконная функция Spark плотности_ранка — без предложения partitionBy
Я использую Spark 1.6.2, Scala 2.10.5 и Java 1.7. Наш вариант использования требует, чтобы мы выполнили плотности_rank() для набора данных из более чем 200 миллионов строк без использования предложения partitionBy, используется только предложение...
2192 просмотров
schedule 09.11.2023

Не удается запустить apache apex cli
Я пытаюсь запустить Apache Apex cli, но не могу этого сделать. документ говорит, что просто введите apex в командной строке, но там написано No command 'apex' found Есть ли какие-то предварительные шаги, которые мне нужно выполнить, прежде чем...
134 просмотров
schedule 02.03.2024

Получить идентификатор приложения пряжи из отправленного задания mapreduce
Мне нужно получить идентификатор приложения пряжи из задания mapreduce. Я не могу найти API для этого. Пример моей работы mapreduce: Configuration conf = new Configuration(); Job job = Job.getInstance(conf, "word count");...
598 просмотров
schedule 10.12.2023

Предложение DISTRIBUTE BY в HIVE
Я не могу понять, что делает это предложение DISTRIBUTE BY в Hive . Я знаю определение, в котором говорится, что если у нас есть DISTRIBUTE BY (city) , это отправит каждый город в другой reducer , но я не получаю того же самого. Рассмотрим...
25301 просмотров
schedule 19.12.2023

Как работает интервал проверки корзины в Hadoop? а зачем нужен checkpoint_intereval?
Я пробовал это практически, чтобы понять концепцию, но мне все еще не ясно. например, fs.trash.interval=9min и fs.trash.checkpoint.interval=2min Теперь я удаляю файл1 в 10:00 и файл2 в 10:03. Он говорит, что он перемещен в...
785 просмотров

Проблемы с темой __consumer_offsets в Kafka 0.10.2.0
У меня была установка kafka с одним узлом. Он работал нормально. Затем я добавил еще одного брокера и создал кластер кафки с двумя узлами. Я не устанавливал отдельный zookeeper и не использовал тот же zookeeper, который поставляется с пакетом...
739 просмотров

Проблемы развертывания Ambari на виртуальных машинах
Я работаю над созданием производственного кластера Hadoop/Spark на нашем предприятии, но сначала провожу тестирование. Просто чтобы получить некоторую семантику: Рабочая ОС: RHEL 7 ЦП: 8-ядерный Оперативная память: 64 ГБ Количество узлов: 12 Тип:...
172 просмотров
schedule 15.05.2024

Hadoop 2: почему для каждой задачи сопоставления или сокращения используются два процесса Linux?
Мы пытаемся перенести наши задания на Hadoop 2 (Hadoop 2.8.1, одноузловой кластер, если быть точным) с Hadoop 1.0.3. Мы используем YARN для управления нашими заданиями по уменьшению карты. Одно из замеченных нами отличий - это наличие двух процессов...
198 просмотров
schedule 20.02.2024

Hive: тип столбца Decimal (12,9) создает исключение NullPointerException с JSONSerDe
У меня есть внешняя таблица, которая указывает на данные json. Я использую serde org.apache.hive.hcatalog.data.JsonSerDe . Я создал представление поверх этой внешней таблицы с помощью DDL: CREATE VIEW `my_table` AS SELECT a.col1, a.col2, ......
391 просмотров
schedule 02.04.2024

Импорт Sqoop из Oracle завершился с ошибкой Exception in thread main java.lang.NoClassDefFoundError: org/apache/hadoop/mapreduce/InputFormat
При попытке импортировать данные из Oracle в Hadoop с помощью Sqoop происходит сбой с ошибкой "Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/mapreduce/InputFormat" Выполнено с этим Вызвано:...
267 просмотров
schedule 13.01.2024

Является ли редьюсер узким местом в структуре MR
Я хочу понять, что делать в следующем случае. Например, у меня есть 1 ТБ текстовых данных, и давайте предположим, что 900 ГБ из них — это слово «Привет». После каждой операции сопоставления у меня будет коллекция пар ключ-значение ‹"Hello",1>. Но...
48 просмотров
schedule 13.01.2024