Перестроить Accumulo после того, как сбой namenode повредит корневой блок

в нашем разрабатываемом кластере HDP произошло отключение питания, которое повредило некоторые системные блоки HDFS, используемые Accumulo, теперь кластер находится в безопасном режиме, и ambari не перезапускается.

Будучи коробкой DEV, HDFS имеет коэффициент репликации, равный 1, поэтому я не могу восстановить поврежденные блоки.

Как лучше всего перестроить Accumulo, чтобы восстановить файловую систему HDFS и восстановить кластер HDP? В накопителе нет пользовательских данных для сохранения, поэтому в этом случае подойдет очистка и повторная инициализация. Просто не уверен, что это лучший способ сделать это.

Некоторые детали коррупции:

hdfs fsck / | egrep -v '^\.+$' | grep -v replica | grep -v Replica| grep "^\/" | grep "CORRUPT" | sed 's/: CORRUPT.*//' | grep -v "^$"

вывод:

Connecting to namenode via http://xyz.fakedomain.com:50070/fsck?ugi=andrew&path=%2F
/apps/accumulo/data/tables/!0/table_info/A000133q.rf
/apps/accumulo/data/tables/+r/root_tablet/A000133t.rf
/apps/accumulo/data/tables/1/default_tablet/F000133r.rf
/user/accumulo/.Trash/Current/apps/accumulo/data/tables/+r/root_tablet/delete+A000133t.rf+F000133s.rf

Детали кластера:

Hortonworks HDP-2.4.0.0-169
Accumulo    1.7.0.2.4
YARN        2.7.1.2.4

person Minkymorgan    schedule 14.05.2016    source источник


Ответы (1)


Сначала найдите плохие блоки с помощью:

hdfs fsck / | egrep -v '^\.+$' | grep -v eplica

затем удалите файл(ы) в рассматриваемом блоке(ах) и удалите с помощью:

hdfs dfs -rm -skipTrash /some/path/to/files

От имени пользователя HDFS выполните следующее:

hdfs dfsadmin -safemode leave

hdfs dfs -rm -R -skipTrash hdfs://servername:8020/apps/accumulo

hadoop fs -mkdir -p /apps/accumulo
hadoop fs -chmod -R 700 /apps/accumulo
hadoop fs -chown -R accumlo:accumulo /apps/accumulo

Из Ambari перезапустите Accumulo для инициализации или запуска:

/usr/hdp/current/accumulo-client/bin/accumulo init

а затем начните с

/usr/hdp/current/accumulo-client/bin/start-all.sh
person Tom Roffe    schedule 16.05.2016
comment
Кластер восстановлен и работает отлично. Спасибо! - person Minkymorgan; 16.05.2016