Redshift INSERT INTO заблокирован во время отдельного COPY

Я недавно играл с Redshift и обнаружил странное (или, может быть, не такое уж странное) поведение. Когда выполняется COPY (из S3), если я выполняю INSERT INTO в совершенно другой таблице в другой схеме, запрос INSERT INTO занимает слишком много времени. Когда в кластере redshift больше ничего не работает, запрос INSERT INTO завершается в течение 3-5 минут. Но при выполнении COPY тот же запрос INSERT INTO занимает 1-2 часа.

Глядя на панель инструментов Redshift, странно то, что пропускная способность чтения близка к нулю. Учитывая, что мой запрос INSERT INTO содержит выборку, я полагаю, что пропускная способность чтения будет выше. Таким образом, создается впечатление, что запрос COPY блокирует все остальные операции записи. Я проверил таблицу LOCKs (STV_LOCKS), и между LOCKS для COPY и INSERT INTO нет конфликта. Возможно ли, что запрос COPY блокирует все остальные операции записи?

заранее спасибо


person gmemon    schedule 21.11.2014    source источник


Ответы (1)


Вам необходимо проверить конфигурацию группы параметров (для вашего кластера в консоли AWS) -> Конфигурация управления рабочей нагрузкой.

Проверьте параллелизм. По умолчанию это 5 . вы можете увеличить значение (максимум до 50). Это позволит одновременные соединения. Когда вы выполняете команду копирования, некоторые соединения используются, поэтому для вставки в запрос может не остаться соединений. Поэтому увеличьте параллелизм и проверьте еще раз.

Надеюсь это поможет

person Sandesh Deshmane    schedule 25.11.2014