Этапы удаления повторяющегося значения из файла в данных

Какой этап можно использовать для удаления повторяющихся значений из файла в DataStage, кроме удаления дубликатов и разделения свойств этапа путем выбора уникального? Как это сделать?


person Saurabh    schedule 14.01.2016    source источник


Ответы (3)


  1. Вы можете использовать этап сортировки и использовать уникальные настройки в свойствах
  2. И используйте трансформатор последовательно и продолжайте проверять входящие строки, являются ли они дублированными или нет, если да, не переходите к выходу, иначе проход
person Atul Singh    schedule 22.02.2016

Есть несколько способов удалить дубликаты, кроме использования этапа удаления дубликатов. Как указано выше, вы можете использовать этап сортировки, этап преобразования.

На этапе сортировки вы можете включить столбец Key Change (), и это будет полезно для фильтрации повторяющихся записей.

Вы можете использовать этап агрегатора для удаления дубликатов. Здесь вам нужно еще 2 этапа скопировать и присоединиться к этапам. Даже мы можем захватить повторяющиеся записи, используя этап удаления дубликатов.

person Naveen Reddy CH    schedule 18.03.2016

Самый простой способ - использовать опцию фильтра в свойствах последовательной стадии файла. В поле фильтра введите команду Unix sort -u, и работа будет выполнена.

person Sundararaman P    schedule 12.10.2016