Метод перетасовки/сортировки MapReduce

Несколько странный вопрос, но кто-нибудь знает, какой тип сортировки использует MapReduce в части сортировки в случайном порядке/сортировке? Я бы подумал о слиянии или вставке (в соответствии со всей парадигмой MapReduce), но я не уверен.


person SubSevn    schedule 25.04.2011    source источник


Ответы (2)


Это быстрая сортировка, после чего отсортированные промежуточные результаты объединяются. Быстрая сортировка проверяет глубину рекурсии и сдается, если она слишком глубокая. В этом случае используется Heapsort.

Взгляните на класс Quicksort:

org.apache.hadoop.util.QuickSort

Вы можете изменить используемый алгоритм с помощью значения map.sort.class в файле hadoop-default.xml.

person Thomas Jungblut    schedule 25.04.2011
comment
Этот метод переключения сортировки является стандартной гибридной сортировкой AFAIK. Он называется IntroSort: en.wikipedia.org/wiki/Introsort. - person Yash Sharma; 20.02.2014

Чтобы узнать больше об этом более подробно, не стесняйтесь читать об этом в сообщении: Map-Reduce:Shuffle and sort в моем блоге: Hadoop: некоторые Важное понимание

person Abhishek Jain    schedule 28.11.2012