Как бы вы это сделали?
Я выполняю процесс ETL для баз данных, в которых в настоящее время нет столбца Date_added/Date_updated. Администратор базы данных не хочет добавлять столбец «Дата» в таблицы, поэтому мне нужно найти альтернативный способ выбора только новых/измененных записей для ночных извлечений. Базы данных огромны, поэтому решение должно быть эффективным с точки зрения пространства/времени, если это возможно.
Решение некоторых дополнительных вопросов:
** В таблицах НЕ включена зависимость от строк.
1) в таблице есть ПК? Да, каждая таблица имеет ПК, уникальный только внутри себя.
2) Огромные БД - это.... миллиарды, миллионы? 10 миллионов записей в самой большой таблице прямо сейчас
3) размер подмножества данных новых/измененных записей для ночных извлечений? Я предполагаю, что около 2000 строк на клиента, умноженные на 100 клиентов, дают 200000.
4) какие-то уникальные значения в ночных добычах? В каждой схеме есть уникальные значения.
date
или новым столбцам как таковым? - person shree.pat18   schedule 14.07.2014