Для требований учебного проекта я выбираю следующую технологию, поскольку источником данных является SQL SERVER.
Начальный размер данных 100Гб и 10 рост@квартал
Информация
Hadoop — многоузловой кластер (1 Namenode + 3 DataNode) Hadoop 3.1.2,
Apache Maven 3.6.0
Ubuntu 18.04
Ambari
Вышеупомянутая установка готова к следующему пункту, оставшемуся
Скуоп: 1.4.7 Улей: 2.3.5 Узи 5.0.0
Должны ли они все устанавливаться на отдельные машины?
Какова стратегия развертывания после завершения разработки?