в нашем разрабатываемом кластере HDP произошло отключение питания, которое повредило некоторые системные блоки HDFS, используемые Accumulo, теперь кластер находится в безопасном режиме, и ambari не перезапускается.
Будучи коробкой DEV, HDFS имеет коэффициент репликации, равный 1, поэтому я не могу восстановить поврежденные блоки.
Как лучше всего перестроить Accumulo, чтобы восстановить файловую систему HDFS и восстановить кластер HDP? В накопителе нет пользовательских данных для сохранения, поэтому в этом случае подойдет очистка и повторная инициализация. Просто не уверен, что это лучший способ сделать это.
Некоторые детали коррупции:
hdfs fsck / | egrep -v '^\.+$' | grep -v replica | grep -v Replica| grep "^\/" | grep "CORRUPT" | sed 's/: CORRUPT.*//' | grep -v "^$"
вывод:
Connecting to namenode via http://xyz.fakedomain.com:50070/fsck?ugi=andrew&path=%2F
/apps/accumulo/data/tables/!0/table_info/A000133q.rf
/apps/accumulo/data/tables/+r/root_tablet/A000133t.rf
/apps/accumulo/data/tables/1/default_tablet/F000133r.rf
/user/accumulo/.Trash/Current/apps/accumulo/data/tables/+r/root_tablet/delete+A000133t.rf+F000133s.rf
Детали кластера:
Hortonworks HDP-2.4.0.0-169
Accumulo 1.7.0.2.4
YARN 2.7.1.2.4