У меня есть структура HDFS что-то вроде
a/b/file1.gz
a/b/file2.gz
a/c/file3.gz
a/c/file4.gz
Я использую классический шаблон
FileInputFormat.addInputPaths(conf, args[0]);
чтобы установить мой входной путь для работы по уменьшению карты Java.
Это прекрасно работает, если я укажу args[0] как a/b, но произойдет сбой, если я укажу только a (моя цель состоит в том, чтобы обработать все 4 файла)
ошибка
Exception in thread "main" java.io.IOException: Not a file: hdfs://host:9000/user/hadoop/a
Как рекурсивно добавить все под a?
Я должен упустить что-то простое...