Какой этап можно использовать для удаления повторяющихся значений из файла в DataStage, кроме удаления дубликатов и разделения свойств этапа путем выбора уникального? Как это сделать?
Этапы удаления повторяющегося значения из файла в данных
Ответы (3)
- Вы можете использовать этап сортировки и использовать уникальные настройки в свойствах
- И используйте трансформатор последовательно и продолжайте проверять входящие строки, являются ли они дублированными или нет, если да, не переходите к выходу, иначе проход
person
Atul Singh
schedule
22.02.2016
Есть несколько способов удалить дубликаты, кроме использования этапа удаления дубликатов. Как указано выше, вы можете использовать этап сортировки, этап преобразования.
На этапе сортировки вы можете включить столбец Key Change (), и это будет полезно для фильтрации повторяющихся записей.
Вы можете использовать этап агрегатора для удаления дубликатов. Здесь вам нужно еще 2 этапа скопировать и присоединиться к этапам. Даже мы можем захватить повторяющиеся записи, используя этап удаления дубликатов.
person
Naveen Reddy CH
schedule
18.03.2016
Самый простой способ - использовать опцию фильтра в свойствах последовательной стадии файла. В поле фильтра введите команду Unix sort -u, и работа будет выполнена.
person
Sundararaman P
schedule
12.10.2016