Этапы удаления повторяющегося значения из файла в данных

Какой этап можно использовать для удаления повторяющихся значений из файла в DataStage, кроме удаления дубликатов и разделения свойств этапа путем выбора уникального? Как это сделать?

datastage

Saurabh 14.01.2016 источник

Ответы (3)

arrow_upward
1
arrow_downward

Вы можете использовать этап сортировки и использовать уникальные настройки в свойствах
И используйте трансформатор последовательно и продолжайте проверять входящие строки, являются ли они дублированными или нет, если да, не переходите к выходу, иначе проход

Atul Singh 22.02.2016

arrow_upward
1
arrow_downward

Есть несколько способов удалить дубликаты, кроме использования этапа удаления дубликатов. Как указано выше, вы можете использовать этап сортировки, этап преобразования.

На этапе сортировки вы можете включить столбец Key Change (), и это будет полезно для фильтрации повторяющихся записей.

Вы можете использовать этап агрегатора для удаления дубликатов. Здесь вам нужно еще 2 этапа скопировать и присоединиться к этапам. Даже мы можем захватить повторяющиеся записи, используя этап удаления дубликатов.

Naveen Reddy CH 18.03.2016

arrow_upward
1
arrow_downward

Самый простой способ - использовать опцию фильтра в свойствах последовательной стадии файла. В поле фильтра введите команду Unix sort -u, и работа будет выполнена.

Sundararaman P 12.10.2016

Этапы удаления повторяющегося значения из файла в данных

Ответы (3)

Похожие вопросы