В нашем кластере хаупов есть 3,5 ТБ данных (да, на hdfs). И мы недавно создали сегментированный кластер mongodb (последняя версия 3.x) с 3 mongos, 3 configdb и 3 осколками (каждый осколок имеет 1 первичный и 2 вторичных узла)
Мы ищем лучший/самый быстрый способ импортировать эти данные из hadoop/hdfs в наш недавно созданный сегментированный кластер mongodb.
Все эти данные будут в сегментированных коллекциях в кластере mongodb.
У нас нет большого опыта в этом, и мы понятия не имеем, как сделать это самым быстрым способом в нашей среде.
Благодарим, если кто-нибудь может дать подсказку или инструменты, которые мы можем использовать. инструменты с открытым исходным кодом или коммерческие нам подходят.
Джо