Набор реплик никогда не завершает клонирование основного узла

Мы работаем с набором данных среднего размера (50 ГБ) в MongoDB и пытаемся добавить третий узел в наш набор реплик (сделав его первичным-вторичным-вторичным). К сожалению, когда мы поднимаем узлы (с соответствующими аргументами командной строки, связывающими их с нашим набором реплик), узлы никогда не выходят из стадии RECOVERING.

Глядя на журналы, кажется, что узлы удаляют все свои данные, как только восстановление завершается, и снова начинают синхронизацию.

Мы используем версию 2.0.3 на всех узлах и попытались добавить третий узел как из «чистого» (пустого db) состояния, так и из состояния начальной загрузки (используя mongodump для создания моментального снимка основной базы данных и mongorestore 'создание этого снимка в новый узел), каждый из которых терпит неудачу.

Мы наблюдали это повторяющееся явление в течение последних 24 часов, и мы будем признательны за любые советы и рекомендации!


person fredugolon    schedule 16.03.2012    source источник


Ответы (2)


Трудно быть уверенным, не просматривая журналы, но похоже, что вы столкнулись с известной проблемой в MongoDB 2.0.3. Проверьте http://jira.mongodb.org/browse/SERVER-5177 . Проблема устранена в версии 2.0.4, для которой доступен релиз-кандидат.

person Andy10gen    schedule 16.03.2012
comment
Спасибо, Энди. На самом деле мы узнали об этом несколько дней назад и с тех пор довели наши узлы до скорости (в нашем случае мы откатились до 2.0.2). - person fredugolon; 18.03.2012

Я не знаю, поможет ли это, но когда у меня возникла эта проблема, я стер базу данных реплики и инициировал ее. Он начался с нуля и воспроизвелся нормально. стоит попробовать, я думаю.

person dicarsio    schedule 17.03.2012