Вопросы по теме 'cloudera'

HBase Thrift: как подключиться к удаленному мастеру/кластеру HBase?
Благодаря дистрибутиву Cloudera у меня есть мастер-узел HBase + сервер Thrift, работающий на локальном компьютере, и я могу кодировать и тестировать клиентские программы HBase и использовать их без проблем. Однако теперь мне нужно использовать...
7413 просмотров
schedule 12.06.2024

Создание Hadoop с помощью Eclipse/Maven — отсутствует артефакт jdk.tools:jdk.tools:jar:1.6
Я пытаюсь импортировать org.apache.hadoop:hadoop-client:2.0.0-cdh4.0.0 из репозитория cdh4 maven в проекте maven в eclipse 3.81, плагин m2e, с oracle jdk 1.7.0_05 на win7 с использованием <dependency>...
124651 просмотров
schedule 15.12.2023

Контейнер AM работает за пределами виртуальной памяти
Я играл с приложением распределенной оболочки (hadoop-2.0.0-cdh4.1.2). Это ошибка, которую я получаю в данный момент. 13/01/01 17:09:09 INFO distributedshell.Client: Got application report from ASM for, appId=5, clientToken=null,...
14767 просмотров
schedule 08.10.2022

Как установить Cloudera Impala на EMR?
В любом случае, я могу установить единственную импалу без менеджера cloudera и без cdh. Я буду использовать версию Hadoop для Apache?
2670 просмотров
schedule 22.10.2022

Есть ли способ показать разделы на Cloudera impala?
Обычно я могу делать show partitions <table> в улье. Но когда это паркет, улей его не понимает. Я могу зайти на hdfs и проверить структуру каталогов, но это не идеально. Есть ли лучший способ сделать это?
8318 просмотров
schedule 19.04.2024

OBIEE подключается к импале
Я пытаюсь подключить OBIEE к Impala. Когда я пробую свой тест, я сталкиваюсь с проблемой, которую не могу решить, вот мои шаги: загрузите последнюю версию драйвера Cloudera Impala ODBC для Windows и импортируйте метаданные из impala. Наконец-то...
1171 просмотров
schedule 01.04.2024

Cloudera vm oozieWorkflow java.lang.ClassNotFoundException
Я новичок в Hadoop, и у меня есть текущая проблема: Я продолжаю получать «java.lang.ClassNotFoundException», когда пытаюсь запустить рабочий процесс oozzie. Я использую виртуальную машину быстрого запуска Cloudera v 4.5. используемые настройки...
896 просмотров
schedule 27.10.2022

Ошибка балансировщика CDH5 hdfs
при запуске «балансировщика hdfs», я вижу, что он показывает установленную топологию стойки, чрезмерно используемые и недостаточно используемые узлы, он говорит: «Необходимо переместить 5 ТБ, чтобы сделать кластер сбалансированным» и «Решено...
2100 просмотров
schedule 30.11.2023

Удаленное выполнение искрового задания
Попытка запустить задание Spark. Spark установлен как пакет внутри Cloudera Hadoop. Как запустить задание Spark удаленно с помощью Java API?
2803 просмотров
schedule 05.06.2024

Поисковая оптимизация с использованием Apache Lucene
Я работаю над проектом по реализации крупномасштабной индексации данных Twitter для оптимизации поиска с использованием Apache Lucene. Lucene предоставляет инвертированный индекс для фильтрации блоков, соответствующих заданным критериям выбора....
82 просмотров
schedule 07.10.2022

Загрузите данные Json с помощью Pig
Я пытаюсь извлечь данные из приведенного ниже формата json с помощью свиньи, используя jsonLoader() :...
3333 просмотров

Улей не определяет формат метки времени
У меня есть сценарий PIG, который Загружает и преобразует данные из CSV Заменяет некоторых персонажей Вызывает java-программу (JAR) для преобразования даты и времени в csv с 06.02.2015 18:52 до 2015-6-2 18:52 (мм / дд / гггг в гггг-мм-дд)...
1965 просмотров
schedule 17.11.2022

Непредвиденное исключение zookeeper, вызывающее отключение, когда носок все еще открыт
Я получаю довольно много серьезных проблем в кластере Cloudera Hadoop 2.0, которые совпадают со следующими ошибками в zookeeper, которые происходят много раз в день. Я не могу найти основную причину этого. Любая помощь приветствуется....
5686 просмотров
schedule 07.11.2022

Как заставить потребителей работать в Kafka 0.8 API
Я собираюсь написать прототип для публикации и использования сообщений kafka. У нас уже настроена инфраструктура Cloudera (зоопарки, брокеры и т. д.), и я уже успешно поиграл с инструментами командной строки Kafka для создания и использования...
1531 просмотров
schedule 02.10.2022

Выбор хранилища больших данных
В настоящее время передо мной стоит задача создать хранилище данных для хранения и обработки огромного количества данных. Предполагаемое количество составляет более 7 миллиардов событий в день. Данные должны храниться в течение 7 дней. Средний...
254 просмотров

Расширение памяти HDFS в Cloudera
Мне нужно расширить память hdfs с 50 ГБ до 200 ГБ в cloudera. Я использую виртуальную машину со свободным пространством 300 ГБ, но hdfs настроен только на использование 50 ГБ на hdfs. Мой dfs.namenode.name.dir указывает на dfs / nn по умолчанию...
294 просмотров
schedule 11.12.2023

использовать cloudera с docker-compose
когда я использую cloudera с докером следующим образом: docker run -it cloudera/quickstart:latest /usr/bin/docker-quickstart Все работает нормально, пользоваться не могу, а доступ к юи через DOCKER_IP:50070 но если я хочу добавить cloudera...
1444 просмотров
schedule 18.05.2024

Невозможно настроить свойства ORC в Spark
Я использую Spark 1.6 (Cloudera 5.8.2) и пробовал следующие методы для настройки свойств ORC. Но это не влияет на вывод. Ниже приведен фрагмент кода, который я пробовал. DataFrame dataframe =...
6026 просмотров
schedule 21.02.2024

Cloudera не может перезапустить улей
Я разочарован Cloudera — продуктом и форумом поддержки, поэтому я решил разместить свой вопрос здесь. По неизвестной причине (может быть, из-за нехватки места на диске) моя виртуальная машина cloudera зависает после одного дня работы, поэтому я...
22 просмотров
schedule 31.01.2024

Настройка java-приложения для работы с HBase (Hue-Cloudera)
Может ли кто-нибудь дать совет о том, как мне настроить мое приложение Java для работы с HBase? К сожалению, этот фундаментальный шаг по настройке Java-приложения для взаимодействия с HBase был исключен из курса PluralSight «Начало работы с HBase»,...
58 просмотров
schedule 29.02.2024