Работя върху платформата Hadoop (от HortonWorks), инсталирана на Windows Server и кодирам Map/Reduce файлове в C#.
Имам входна папка със 100k xml файла. Искам да прочета всеки xml файл и да напиша всеки етикет в един ред. Моля, следвайте примера по-долу.
ВХОД:
<Person>
<a>1</a>
<b>2</b>
<c>3</c>
</Person>
ИЗХОД 1,2,3 .... ....
Можете ли да ми предоставите информация за това как трябва да чета данни от сега. Mapper се предоставя с отделни файлове за всеки файл, където е трудно да се анализират отделни тагове.