Вопросы по теме 'hadoop-streaming'

Потоковая передача Hadoop: как посмотреть журналы приложений?
Я вижу все журналы Hadoop на моем пути /usr/local/hadoop/logs но где я могу увидеть журналы уровня приложения? Например : картограф.py import logging def main(): logging.info("starting map task now") // -- do some task -- //...
6296 просмотров

кластер hadoop: задача сопоставления выполняется только на одной машине, а не на всех
У меня есть hadoop cluster of three machines , где одна машина действует и как ведущая, и как ведомая. Когда я запускаю wordcount-example , он запускает задачи карты на двух машинах — worker1 и worker2 . Но когда я запускаю свой...
1256 просмотров
schedule 30.05.2024

Как включить FileName в Pig Latin Script с помощью XMLLoader?
Я использую XMLLoader для загрузки XML в мой свиной латинский скрипт. А затем анализирую его с помощью своего UDF. Проблема в том, что я хочу включить имя входного файла в свой UDF. Что-то типа имя_файла = (строка) input.get(1); Вот мой...
581 просмотров
schedule 05.10.2022

входной формат Hadoop для потоковой передачи Hadoop. Формат ввода Wikihadoop
Интересно, есть ли какие-либо различия между InputFormats для потоковой передачи Hadoop и Hadoop. Работают ли входные форматы для потоковой передачи Hadoop также для Hadoop и наоборот? Я спрашиваю об этом, потому что нашел специальный формат ввода...
300 просмотров
schedule 06.12.2023

Карта ввода XML-файла/сокращение Hadoop Windows Server
Я работаю над платформой Hadoop (от HortonWorks), установленной на Windows Server, и кодирую файлы Map/Reduce на С#. У меня есть входная папка с файлами 100k xml. Я хочу прочитать каждый файл xml и записать каждый тег в одну строку. Пожалуйста,...
2078 просмотров

Python MapReduce Hadoop Streaming Job, которому требуется несколько входных файлов?
У меня есть два файла в моем кластере File A и File B со следующими данными: Файл А #Format: #Food Item | Is_A_Fruit (BOOL) Orange | Yes Pineapple | Yes Cucumber | No Carrot | No Mango | Yes Файл B #Format: #Food Item | Vendor...
14598 просмотров
schedule 22.03.2024

Как переобучить классификатор изображений Inception в среде Hadoop
Недавно я попробовал классификатор изображений Google Inception на своем ПК с операционной системой Win10. По сути, я прошел через это учебник/руководство . Вкратце шаги были такими: Установить Докер Установить Тензорфлоу Получить...
295 просмотров

Как работает интервал проверки корзины в Hadoop? а зачем нужен checkpoint_intereval?
Я пробовал это практически, чтобы понять концепцию, но мне все еще не ясно. например, fs.trash.interval=9min и fs.trash.checkpoint.interval=2min Теперь я удаляю файл1 в 10:00 и файл2 в 10:03. Он говорит, что он перемещен в...
785 просмотров

Функция MAX(Count) apache pig Latin
В приведенной ниже программе я пытаюсь сделать это в Apache Pig как есть и с неструктурированными данными. i) У меня есть набор данных, который содержит название улицы, город и штат: ii) Группировка по штатам iii) Я беру COUNT(*) состояний в...
330 просмотров

как настроить соединение SQL/Hive с кластером cloudera для чтения данных, хранящихся в кластере
Я хотел получить данные, хранящиеся в кластере Hadoop Cloudera, через Hive, Spark или SQL. У меня есть SQL-запрос, который должен получать данные из кластера. Но перед этим я хочу понять, как настроить соединение /Курсор с кластером, чтобы он знал,...
69 просмотров
schedule 11.10.2022

Запуск программы MapReduce на Hadoop выводит только половину моих данных
Я запускаю простую программу MapReduce на Hadoop, вычисляя минимальное, максимальное, медианное и стандартное отклонение значений из столбца набора данных. Когда я запускаю это локально на своем компьютере, я получаю окончательный результат,...
352 просмотров

oozie java.io.IOException: нет файловой системы для схемы: hdfs
Я настроил oozie 4.3.1 с Hadoop 2.7.3. oozie успешно настроен и работает и может видеть веб-консоль http://localhost:11000/oozie/ . а также подтвердите, используя команду статуса oozie. Проблема 1: при запуске примеров oozie после изменения...
70 просмотров