Вопросы по теме 'hadoop-streaming'
Потоковая передача Hadoop: как посмотреть журналы приложений?
Я вижу все журналы Hadoop на моем пути /usr/local/hadoop/logs
но где я могу увидеть журналы уровня приложения? Например :
картограф.py
import logging
def main():
logging.info("starting map task now")
// -- do some task -- //...
6296 просмотров
schedule
25.09.2022
кластер hadoop: задача сопоставления выполняется только на одной машине, а не на всех
У меня есть hadoop cluster of three machines , где одна машина действует и как ведущая, и как ведомая.
Когда я запускаю wordcount-example , он запускает задачи карты на двух машинах — worker1 и worker2 . Но когда я запускаю свой...
1256 просмотров
schedule
30.05.2024
Как включить FileName в Pig Latin Script с помощью XMLLoader?
Я использую XMLLoader для загрузки XML в мой свиной латинский скрипт. А затем анализирую его с помощью своего UDF. Проблема в том, что я хочу включить имя входного файла в свой UDF.
Что-то типа
имя_файла = (строка) input.get(1);
Вот мой...
581 просмотров
schedule
05.10.2022
входной формат Hadoop для потоковой передачи Hadoop. Формат ввода Wikihadoop
Интересно, есть ли какие-либо различия между InputFormats для потоковой передачи Hadoop и Hadoop. Работают ли входные форматы для потоковой передачи Hadoop также для Hadoop и наоборот? Я спрашиваю об этом, потому что нашел специальный формат ввода...
300 просмотров
schedule
06.12.2023
Карта ввода XML-файла/сокращение Hadoop Windows Server
Я работаю над платформой Hadoop (от HortonWorks), установленной на Windows Server, и кодирую файлы Map/Reduce на С#.
У меня есть входная папка с файлами 100k xml. Я хочу прочитать каждый файл xml и записать каждый тег в одну строку. Пожалуйста,...
2078 просмотров
schedule
08.05.2024
Python MapReduce Hadoop Streaming Job, которому требуется несколько входных файлов?
У меня есть два файла в моем кластере File A и File B со следующими данными:
Файл А
#Format:
#Food Item | Is_A_Fruit (BOOL)
Orange | Yes
Pineapple | Yes
Cucumber | No
Carrot | No
Mango | Yes
Файл B
#Format:
#Food Item | Vendor...
14598 просмотров
schedule
22.03.2024
Как переобучить классификатор изображений Inception в среде Hadoop
Недавно я попробовал классификатор изображений Google Inception на своем ПК с операционной системой Win10. По сути, я прошел через это учебник/руководство .
Вкратце шаги были такими:
Установить Докер
Установить Тензорфлоу
Получить...
295 просмотров
schedule
18.02.2024
Как работает интервал проверки корзины в Hadoop? а зачем нужен checkpoint_intereval?
Я пробовал это практически, чтобы понять концепцию, но мне все еще не ясно.
например, fs.trash.interval=9min и fs.trash.checkpoint.interval=2min
Теперь я удаляю файл1 в 10:00 и файл2 в 10:03. Он говорит, что он перемещен в...
785 просмотров
schedule
23.12.2023
Функция MAX(Count) apache pig Latin
В приведенной ниже программе я пытаюсь сделать это в Apache Pig как есть и с неструктурированными данными.
i) У меня есть набор данных, который содержит название улицы, город и штат:
ii) Группировка по штатам
iii) Я беру COUNT(*) состояний в...
330 просмотров
schedule
30.01.2024
как настроить соединение SQL/Hive с кластером cloudera для чтения данных, хранящихся в кластере
Я хотел получить данные, хранящиеся в кластере Hadoop Cloudera, через Hive, Spark или SQL. У меня есть SQL-запрос, который должен получать данные из кластера. Но перед этим я хочу понять, как настроить соединение /Курсор с кластером, чтобы он знал,...
69 просмотров
schedule
11.10.2022
Запуск программы MapReduce на Hadoop выводит только половину моих данных
Я запускаю простую программу MapReduce на Hadoop, вычисляя минимальное, максимальное, медианное и стандартное отклонение значений из столбца набора данных. Когда я запускаю это локально на своем компьютере, я получаю окончательный результат,...
352 просмотров
schedule
04.11.2023
oozie java.io.IOException: нет файловой системы для схемы: hdfs
Я настроил oozie 4.3.1 с Hadoop 2.7.3.
oozie успешно настроен и работает и может видеть веб-консоль http://localhost:11000/oozie/ . а также подтвердите, используя команду статуса oozie.
Проблема 1: при запуске примеров oozie после изменения...
70 просмотров
schedule
05.12.2022