У меня есть mrjob, который состоит из 3 шагов. Второй шаг ожидает в качестве входных данных результатов первого шага, а также еще некоторого контента из S3.
Я понимаю, что я всегда могу «пропустить» его через первый шаг, то есть эммит как есть, и использовать его только на втором шаге, но я хотел бы избежать этого.
Есть ли способ определить дополнительный ввод для более поздних шагов в mrjob?