Копирайте файлове от хранилището на Azure Data Lake

Настроих тръбопровод в Azure Data Factory за 1) Копиране на файлове от Storage в Lake 2) u-sql за обединяване/обработка на копираните файлове и извеждане в един файл 3) отваряне и обработка на този обединен файл (вмъкване в DB).

Каквото и да опитвам, по отношение на разрешенията, стъпка 3 се проваля. Всички демонстрации и уроци за Azure data lake спират до извеждането на изходния файл, който претендира за успех. свършена работа и т.н.

Намирам docs.microsoft за това доста заплетен (може да се дължи на Gen1/Gen2 Lake??). Разбира се, това, което се опитвам да направя, е общ сценарий, вземам някои файлове с данни, обединявам и извеждам, обработвам изхода.

Изглежда, че файлът, създаден от процеса u-sql, има различен собственик от другите файлове, така че най-често срещаната грешка е 403. Когато настройвам тръбопроводите в ADF, мога да преглеждам папките в lake storage и т.н., за да конфигурирам, но не може да отвори файла, без да зададе всички разрешения за файла в Lake storage. Когато отстранявам грешки/изпълня тръбопровода в ADF, новият изходен файл няма тези разрешения, така че стъпката на изходния файл на процеса в тръбопровода е неуспешна.

Всички тези ресурси са настроени в един и същ абонамент за Azure.


person David Quinlan    schedule 30.01.2020    source източник


Отговори (1)


Вече разреших този проблем с разрешенията. Ако някой се интересува, малко информация и насоки тук... https://www.sqlservercentral.com/stairways/stairway-to-u-sql

освен това този курс е доста добро въведение.

https://app.pluralsight.com/library/courses/u-sql-azure-data-lake/

person David Quinlan    schedule 31.01.2020