У меня есть таблица в моей базе данных MySQL, содержащая 200K записей. Каждая запись содержит URL-адрес, который нужно каким-то образом обработать. Обработка URL-адресов в моем случае - нетривиальная задача, поэтому я решил использовать очередь Gearman для их запуска в фоновом режиме. рабочие места.
Итак, для каждой записи (URL) в моей таблице я планирую создать отдельную задачу и передать ее Gearman.
Кроме того, данные в моей таблице не статичны, и очень часто туда будут добавляться новые URL-адреса.
Согласно моей бизнес-логике, мне нужно постоянно обрабатывать этот список URL-адресов. Когда я завершу обработку последней записи в моей таблице БД, я должен перейти к первой, и процесс должен быть повторен для всех записей снова.
Итак, мои вопросы:
- Как лучше поставить задачи в Gearman в этом случае?
- Стоит ли использовать cron или можно организовать логику, при которой Gearman будет автоматически тянуть задачи?
- Сколько задач можно отправить в Gearman за один раз?
Итак, не могли бы вы рассказать мне, как лучше всего реализовать эту систему?