В любом случае, я могу установить единственную импалу без менеджера cloudera и без cdh. Я буду использовать версию Hadoop для Apache?
Как установить Cloudera Impala на EMR?
Ответы (3)
Да, это абсолютно возможно. Добавьте репозиторий в свой файл sources.list
и после этого обновите репозиторий.
deb [arch=amd64] http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala точный-impala1 вклад deb-src http://archive.cloudera.com/impala/ubuntu/precise/amd64/impala точный-impala1 вклад
После этого просто:
sudo apt-get install impala (Binaries for daemons)
sudo apt-get install impala-server (Service start/stop script)
sudo apt-get install impala-state-store (Service start/stop script)
Но не забудьте выполнить все обязательные условия. Для получения подробной информации вы можете перейти по адресу здесь
Подробные инструкции по установке и использованию Impala с Amazon EMR можно посмотреть здесь: http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-impala.html
EMR основан на дистрибутиве Amazon Hadoop, который работает поверх сжатия Debian. Итак, да, это возможно с помощью репозитория Cloudera DEB.
Вам потребуется подключиться по SSH к мастер-ноде EMR, найти адрес в консоли EMR.
Вам также потребуется включить правила безопасности в группе безопасности, которую вы назначили своему кластеру EMR, если вы собираетесь подключаться к Impala с помощью клиента JDBC/ODBC из внешнего мира.