создание таблицы куста с помощью udf

У меня есть кусок данных на s3 в формате orc. мое требование состоит в том, чтобы замаскировать определенные столбцы. Какой будет лучший подход с минимальными изменениями?

Могу ли я определить udf на уровне таблицы куста, и всякий раз, когда столбец ссылается из hive/preso по умолчанию, udf будет выполнять и маскировать данные на лету?

Ваш ответ будет оценен. Спасибо!


person user2064043    schedule 19.06.2020    source источник


Ответы (1)


Это называется маскированием столбца. Для этого вы обычно используете Presto (или Hive) с защитой Ranger и настраиваете там маскирование столбцов.

Ranger определяет набор предопределенных масок (например, маскировать все символы/цифры, кроме последних 4, и т. д.).

Ranger также позволяет создавать собственные маски (выражение свободного стиля), но Presto пока не поддерживает их.

person Piotr Findeisen    schedule 20.06.2020
comment
В настоящее время мы работаем на AWS, а безопасность и роли поддерживаются с помощью IAM. Итак, могу ли я использовать Ranger только для реализации маскирования? - person user2064043; 24.06.2020