Публикации по тематике hadoop-streaming

Вопросы по теме 'hadoop-streaming'

Потоковая передача Hadoop: как посмотреть журналы приложений?

Я вижу все журналы Hadoop на моем пути /usr/local/hadoop/logs но где я могу увидеть журналы уровня приложения? Например : картограф.py import logging def main(): logging.info("starting map task now") // -- do some task -- //...

6296 просмотров

25.09.2022

кластер hadoop: задача сопоставления выполняется только на одной машине, а не на всех

У меня есть hadoop cluster of three machines , где одна машина действует и как ведущая, и как ведомая. Когда я запускаю wordcount-example , он запускает задачи карты на двух машинах — worker1 и worker2 . Но когда я запускаю свой...

1256 просмотров

python hadoop mapreduce hadoop-streaming

30.05.2024

Как включить FileName в Pig Latin Script с помощью XMLLoader?

Я использую XMLLoader для загрузки XML в мой свиной латинский скрипт. А затем анализирую его с помощью своего UDF. Проблема в том, что я хочу включить имя входного файла в свой UDF. Что-то типа имя_файла = (строка) input.get(1); Вот мой...

581 просмотров

hadoop hadoop-streaming apache-pig

05.10.2022

входной формат Hadoop для потоковой передачи Hadoop. Формат ввода Wikihadoop

Интересно, есть ли какие-либо различия между InputFormats для потоковой передачи Hadoop и Hadoop. Работают ли входные форматы для потоковой передачи Hadoop также для Hadoop и наоборот? Я спрашиваю об этом, потому что нашел специальный формат ввода...

300 просмотров

hadoop hadoop-streaming

06.12.2023

Карта ввода XML-файла/сокращение Hadoop Windows Server

Я работаю над платформой Hadoop (от HortonWorks), установленной на Windows Server, и кодирую файлы Map/Reduce на С#. У меня есть входная папка с файлами 100k xml. Я хочу прочитать каждый файл xml и записать каждый тег в одну строку. Пожалуйста,...

2078 просмотров

xml hadoop mapreduce hadoop-streaming windows-server-2008

08.05.2024

Python MapReduce Hadoop Streaming Job, которому требуется несколько входных файлов?

14598 просмотров

python hadoop mapreduce hadoop-streaming

22.03.2024

Как переобучить классификатор изображений Inception в среде Hadoop

Недавно я попробовал классификатор изображений Google Inception на своем ПК с операционной системой Win10. По сути, я прошел через это учебник/руководство . Вкратце шаги были такими: Установить Докер Установить Тензорфлоу Получить...

295 просмотров

python tensorflow pyspark hadoop hadoop-streaming

18.02.2024

Как работает интервал проверки корзины в Hadoop? а зачем нужен checkpoint_intereval?

Я пробовал это практически, чтобы понять концепцию, но мне все еще не ясно. например, fs.trash.interval=9min и fs.trash.checkpoint.interval=2min Теперь я удаляю файл1 в 10:00 и файл2 в 10:03. Он говорит, что он перемещен в...

785 просмотров

apache-spark hadoop hadoop2 hadoop-streaming

23.12.2023

Функция MAX(Count) apache pig Latin

В приведенной ниже программе я пытаюсь сделать это в Apache Pig как есть и с неструктурированными данными. i) У меня есть набор данных, который содержит название улицы, город и штат: ii) Группировка по штатам iii) Я беру COUNT(*) состояний в...

330 просмотров

hadoop hadoop-partitioning hadoop-streaming apache-pig

30.01.2024

как настроить соединение SQL/Hive с кластером cloudera для чтения данных, хранящихся в кластере

Я хотел получить данные, хранящиеся в кластере Hadoop Cloudera, через Hive, Spark или SQL. У меня есть SQL-запрос, который должен получать данные из кластера. Но перед этим я хочу понять, как настроить соединение /Курсор с кластером, чтобы он знал,...

69 просмотров

apache-spark-sql hive hadoop-streaming

11.10.2022

Запуск программы MapReduce на Hadoop выводит только половину моих данных

Я запускаю простую программу MapReduce на Hadoop, вычисляя минимальное, максимальное, медианное и стандартное отклонение значений из столбца набора данных. Когда я запускаю это локально на своем компьютере, я получаю окончательный результат,...

352 просмотров

python-3.x python hadoop mapreduce hadoop-streaming

04.11.2023

oozie java.io.IOException: нет файловой системы для схемы: hdfs

Я настроил oozie 4.3.1 с Hadoop 2.7.3. oozie успешно настроен и работает и может видеть веб-консоль http://localhost:11000/oozie/ . а также подтвердите, используя команду статуса oozie. Проблема 1: при запуске примеров oozie после изменения...

70 просмотров

hadoop oozie hadoop-streaming oozie-workflow oozie-coordinator

05.12.2022

Вопросы по теме 'hadoop-streaming'

Похожие вопросы