Недавно у меня был неудачный опыт развертывания статического веб-сайта на двух серверах. Развертывание завершилось неудачно, и веб-сайт был недоступен для пользователей примерно 30 минут. Я пишу этот пост в блоге, чтобы поделиться тем, что произошло, что я узнал и как я собираюсь предотвратить повторение этого.

Проблема

Основной причиной сбоя стала неправильная конфигурация файлов конфигурации Nginx на одном из серверов. Неправильная конфигурация привела к сбою Nginx при попытке загрузить файлы веб-сайта.

Хронология

Вот хронология того, что произошло:

10:00: я начал процесс развертывания.
10:15: я получил предупреждение от системы мониторинга о том, что один из серверов не работает.
10:20: Я исследовал проблему и определил, что сервер Nginx вышел из строя.
10:30: Я исправил неправильную конфигурацию и перезапустил Nginx.
10:45: работа веб-сайта восстановлена.

Юмор этой истории

Юмор в этой истории заключается в том, что отключение было вызвано такой простой ошибкой. Опечатка в конфигурационном файле Nginx — это все, что потребовалось, чтобы сайт закрылся.

Не знаю, смеяться мне над этим или плакать. С одной стороны, забавно, что такая маленькая ошибка может иметь такие большие последствия. С другой стороны, это тоже как-то бесит.

Извлеченные уроки

Из этого опыта я узнал несколько вещей:

Даже самые незначительные ошибки могут иметь серьезные последствия.
Важно иметь процесс проверки всех изменений в критических системах.
Также важно иметь контрольный список шагов, которые необходимо выполнить при развертывании нового веб-сайта.

Заключение

Я уверен, что смогу предотвратить повторение подобного. Я уже выполнил две рекомендации, о которых упоминал выше. Я также буду более осторожен при внесении изменений в файлы конфигурации Nginx.