Я хочу сделать что-то действительно простое (я думаю). Я запускаю свою пользовательскую банку в EMR Spark. Сейчас я делаю что-то вроде
sbt assembly
и создается толстая банка (80–120 МБ), которую сложно загрузить в S3.
Я хочу использовать
sbt pack
Чтобы получить все банки в папке, загрузите один раз в S3, а затем каждый раз, когда я хочу загрузить новую банку, я буду загружать скомпилированную, без зависимостей.
Я считаю, что это может произойти с bootstrap.sh, который скопирует все банки в кластер, а затем использует параметр --jars
.
Кто-нибудь сделал это?