Я использую фабрику данных Azure для копирования данных из Azure Data Lake Store в коллекцию в Cosmos DB. У нас будет несколько тысяч файлов JSON в озере данных, и каждый файл JSON будет занимать прибл. 3 ГБ. Я использую операцию копирования фабрики данных, и при первоначальном запуске загрузка одного файла заняла 3,5 часа с набором сбора 10000 RU / с и фабрикой данных с настройками по умолчанию. Теперь я увеличил его до 50000 RU / с, установил cloudDataMovementUnits на 32 и writeBatchSize на 10, чтобы посмотреть, улучшилась ли скорость, и тот же файл теперь загружается за 2,5 часа. Тем не менее, загрузка тысяч файлов займет много времени.
Есть ли способ сделать это лучше?