Я работаю в Amazon EMR более года, но недавно мы перешли на aws glue
для обработки данных.
Мне трудно понять взаимосвязь между no of dpus
и max concurrency
, которую мы обеспечиваем при работе с клеем.
Например, я создал задание с 2 dpus
с max concurrency as 2
. Кроме того, представьте, что я two threads
одновременно запускаю эту конечную точку (задание).
Допустим, я выполняю некоторую агрегацию на 60GB file
. Я нашел несколько сообщений, но они не особо помогли, например это и это
Сколько запусков заданий я могу ожидать для этого задания на aws Glue?