Я новичок в Hadoop и в настоящее время пытаюсь объединить два источника данных, где ключом является интервал (например, [дата-начало/дата-конец] ). Например:
вход1:
20091001-20091002 A
20091011-20091104 B
20080111-20091103 C
(...)
вход2:
20090902-20091003 D
20081015-20091204 E
20040011-20050101 F
(...)
Я хотел бы найти все записи, в которых ключ1 перекрывает ключ2. Возможно ли это с помощью хаупа? Где найти пример реализации?
Спасибо.