Недавно я настроил hadoop в псевдораспределенном режиме, создал данные и загрузил их в HDFS. Позже я отформатировал namenode из-за проблемы. Теперь, когда я это делаю, я обнаруживаю, что каталоги и файлы, которые уже были на узлах данных, больше не отображаются. (слово «форматирование» имеет смысл) Но теперь у меня есть это сомнение. Поскольку namenode больше не хранит метаданные файлов, отключен ли доступ к ранее загруженным файлам? Если да, то как нам удалить данные, уже имеющиеся на узлах данных?
Как отформатировать узлы данных после форматирования узла имен на hdfs?
Ответы (1)
Ваши предыдущие каталоги узлов данных теперь устарели, да.
Вам необходимо вручную просмотреть каждый узел данных и удалить содержимое этих каталогов. Нет такой команды форматирования через Hadoop CLI.
По умолчанию каталог узла данных представляет собой отдельную папку в / tmp.
В противном случае вы настроили свои XML-файлы для хранения данных.
person
OneCricketeer
schedule
24.05.2018