У меня есть hadoop cluster of three machines
, где одна машина действует и как ведущая, и как ведомая.
Когда я запускаю wordcount-example , он запускает задачи карты на двух машинах — worker1
и worker2
. Но когда я запускаю свой собственный код, он выполняется только на одном компьютере - worker1
, как мне заставить задачи карты выполняться на всех компьютерах?
Input Split Locations
/default-rack/master
/default-rack/worker1
/default-rack/worker2
ИСПРАВЛЕНО!!!
Я добавил следующее в свою конфигурацию mapred-site.xml
, и это исправлено
<property>
<name>mapred.map.tasks</name>
<value>100</value>
</property>
mapred.map.tasks
решило проблему? - person Praveen Sripati   schedule 17.11.2011