Могу ли я установить второй Hadoop с CDH, если я уже установил Hadoop с Ambari? На тех же машинах

Могу ли я иметь второй кластер Hadoop с CDH, если у меня уже установлен кластер Hadoop с Ambari на тех же трех машинах? Если да, как я могу перенести данные из исходного кластера в новый кластер? Спасибо.


person L. Ma    schedule 07.06.2018    source источник


Ответы (2)


Да, можно, но это не простая задача. У вас будут конфликты портов между службами HDP и CDH. Итак, вам придется выбрать разные порты для кластера CDH. Еще одна проблема, о которой нужно позаботиться — оба кластера захотят использовать /etc/hadoop, /etc/hive,... для хранения файлов конфигурации. Таким образом, один из кластеров должен быть настроен на использование другого местоположения.

Что касается переноса данных, используйте distcp.

person facha    schedule 07.06.2018

То, чего вы пытаетесь достичь, называется «поглощение Ambari» или «поглощение кластера». Дополнительные сведения см. в этом обсуждении. .

Некоторые важные примечания отсюда: это будет довольно сложно и сложно, так как вам придется выполнить новую настройку Ambari и завершить Ambari Takeover существующего кластера HDP без резервного копирования базы данных. У вас есть три варианта:

  1. Если кластер не является производственным и есть возможность очистки кластера, я бы рекомендовал очистить кластер и установить новый с помощью Ambari. Это сэкономит вам много времени. Даже если есть какие-то данные, просто взвесьте время и усилия, чтобы найти компромисс между резервным копированием данных и выполнением новой установки по сравнению с выполнением Ambari Takeover, как описано на высоком уровне в следующих двух вариантах.

  2. Перехват кластера с использованием API-интерфейсов Ambari Настройте сервер Ambari и базу данных Ambari, как и ранее, на новой машине. Обновите агенты Ambari, чтобы они указывали на хост сервера Ambari. Используйте API-интерфейсы Ambari для выполнения захвата кластера, т. е. добавления кластера, добавления хостов, регистрации служб и компонентов, регистрации компонентов хоста. Ниже приведены API-интерфейсы Ambari. https://cwiki.apache.org/confluence/display/AMBARI/API+usage+scenarios%2C+troubleshooting%2C+and+other+FAQs

  3. Третий вариант — выполнить установку фиктивного кластера с помощью Ambari, а затем обновить конфигурации в Ambari.

Примечание. Убедитесь, что вы делаете резервные копии базы данных, устанавливаете каталоги и конфигурации с регулярной частотой в будущем и перемещаете их на другой сервер резервного копирования или HDFS, чтобы избежать дальнейших проблем из-за сбоев оборудования. Примечание. Убедитесь, что вы делаете резервные копии базы данных, устанавливаете каталоги и конфигурации с регулярной частотой в будущем и перемещаете их на другой сервер резервного копирования или HDFS, чтобы избежать дальнейших проблем из-за сбоев оборудования.

person Dmitriusan    schedule 11.06.2018