У меня есть сервер, работающий на Kubernetes, для обработки почасовых заданий. Подумайте об использовании службы для предоставления подов и об использовании (внешнего) задания cron для работы с балансировщиком нагрузки, чтобы кубернеты могли автоматически масштабироваться для обработки более высокой нагрузки по мере необходимости. Однако при реализации, если задание cron отправляет, скажем, 100 запросов одновременно, в то время как есть только 1 модуль, весь трафик будет идти в этот модуль, тогда как впоследствии развернутые модули по-прежнему не будут иметь никакого трафика для обработки.
Как я могу обойти эту проблему? Могу ли я сначала масштабировать поды, используя задание cron, прежде чем делать запросы? Или мне следует делать запросы с задержкой по времени, чтобы дать стручкам время развернуться? Или другие предложения также приветствуются!