Я работаю над платформой Hadoop (от HortonWorks), установленной на Windows Server, и кодирую файлы Map/Reduce на С#.
У меня есть входная папка с файлами 100k xml. Я хочу прочитать каждый файл xml и записать каждый тег в одну строку. Пожалуйста, следуйте приведенному ниже примеру.
ВХОД:
<Person>
<a>1</a>
<b>2</b>
<c>3</c>
</Person>
ВЫХОД 1,2,3 .... ....
Не могли бы вы предоставить мне информацию о том, как я должен читать данные на данный момент. Mapper поставляется с отдельными файлами каждого файла, где трудно разобрать отдельные теги.