Маршрут 53 / ELB не работает при интенсивном движении? Необходимы советы по проверке здоровья

Это моя установка на Amazon Web Services

  • Экземпляры EC2
  • Автомасштабирование + балансировщик нагрузки
  • Маршрут 53 с A-записью, указывающей на loadbalancer
  • .fi-домен

Эта установка нормально работает. Однако при интенсивном трафике mydomain.fi иногда не отвечает. Однако странно то, что подключение напрямую к общедоступному DNS балансировщика нагрузки работает нормально.

На мой взгляд, проблема заключается в одном из следующих:

  1. LB подключается к неработоспособному/не инициализированному экземпляру
  2. Проблема с Route53 (неправильная конфигурация?)
  3. (Проблема с доменом .fi)

Я предполагаю, что наиболее вероятная проблема заключается в том, что отдельные экземпляры EC2 не работают. В настоящее время я не использую никаких проверок работоспособности, чтобы проверить, отвечают ли экземпляры. Может ли это помочь? Какие-нибудь советы по лучшей практике с этим и Route 53 + LB?

Большое спасибо!


person fhollste    schedule 24.02.2014    source источник


Ответы (1)


Я бы сказал, что проблема именно в том, что вы не используете никаких проверок работоспособности. Как ELB может узнать, исправны ли ваши экземпляры ec2 и отвечают ли они, если вы не настроили проверку работоспособности?

Тот факт, что проблема возникает только в период высокой активности, только еще больше указывает на вероятность того, что это ваша проблема.

Если вы потрудились настроить ELB, вам также необходимо настроить проверки работоспособности, чтобы он выполнял свои функции — избегал отправки трафика на узел, который не может его обработать.

person E.J. Brennan    schedule 24.02.2014
comment
Теперь я понял, что ваш балансировщик нагрузки будет автоматически выполнять проверки работоспособности ваших инстансов EC2 и направлять трафик только на инстансы, прошедшие проверку работоспособности. Если экземпляр не проходит проверку работоспособности, он автоматически удаляется из балансировщика нагрузки. Протокол Ping: TCP Порт Ping: 80 Время ожидания ответа: 5 секунд Интервал проверки работоспособности: 0,5 минуты Порог неработоспособности: 5 Порог работоспособности: 3 Я не устанавливал никаких других проверок работоспособности, например. для маршрута 53. Должен ли я просто изменить эти пороговые значения или что посоветуете? - person fhollste; 24.02.2014
comment
Кроме того, пока у меня была эта проблема, все экземпляры казались исправными в соответствии с проверкой доступности системы и проверкой доступности экземпляра в списке экземпляров. Как работает общедоступный DNS LB? Это просто потому, что он случайно выбрал другой экземпляр, который оказался рабочим? - person fhollste; 24.02.2014
comment
Я потерял из виду ваш вопрос; изначально вы сказали, что у вас не включены проверки работоспособности, и мой ответ попытался помочь вам в этом. Если это больше не вопрос, я бы посоветовал вам задать другой вопрос со всеми соответствующими деталями, и вы получите лучший совет. Я не совсем понимаю/следую вашим комментариям выше. - person E.J. Brennan; 24.02.2014
comment
Таким образом, очевидно, что ELB автоматически выполняет проверки работоспособности с вышеупомянутыми параметрами. Мой вопрос: следует ли добавить дополнительные проверки работоспособности или настроить значения по умолчанию, чтобы обеспечить оптимальную производительность? - person fhollste; 24.02.2014