Удалить дубликаты
Узел Удалить дубликаты выполняет операцию дедупликации данных входной таблицы по набору уникальных значений в выбранных колонках.
При дедупликации не по полному набору колонок можно дополнительно задать сортировку, чтобы определить "первую строку" набора, попадающую в выходную таблицу, то есть чтобы получать воспроизводимые результаты.
Расширенный аналог реляционного оператора DISTINCT
.
Входные данные — таблица с данными.
Выходные данные — таблица с данными.
Свойства узла
- Название
Укажите название узла, которое будет отображаться на диаграмме процесса и в журнале событий.
- Описание
Укажите произвольное описание узла.
- Ключевые колонки
Добавьте колонки входной таблицы, для задания набора колонок, по значениям которых будет выполнена дедупликация. - Сортировка
Добавьте колонки входной таблицы, сортировка по которым определит "первую строку" набора.
Замечание
"Первая строка" каждого набора непредсказуема, если только не применяется сортировка, определяющая, какие строки должны быть первыми.
Замечание
Автодополнение при выборе колонок будет доступно после запуска процесса.