Как отформатировать узлы данных после форматирования узла имен на hdfs?

Недавно я настроил hadoop в псевдораспределенном режиме, создал данные и загрузил их в HDFS. Позже я отформатировал namenode из-за проблемы. Теперь, когда я это делаю, я обнаруживаю, что каталоги и файлы, которые уже были на узлах данных, больше не отображаются. (слово «форматирование» имеет смысл) Но теперь у меня есть это сомнение. Поскольку namenode больше не хранит метаданные файлов, отключен ли доступ к ранее загруженным файлам? Если да, то как нам удалить данные, уже имеющиеся на узлах данных?


person Sai Darahaas Ayyangalam    schedule 23.05.2018    source источник


Ответы (1)


Ваши предыдущие каталоги узлов данных теперь устарели, да.

Вам необходимо вручную просмотреть каждый узел данных и удалить содержимое этих каталогов. Нет такой команды форматирования через Hadoop CLI.

По умолчанию каталог узла данных представляет собой отдельную папку в / tmp.

В противном случае вы настроили свои XML-файлы для хранения данных.

Где HDFS хранит данные

person OneCricketeer    schedule 24.05.2018