Я работаю в Scala для программирования в Spark на автономном компьютере (ПК с Windows 10). Я новичок и у меня нет опыта программирования на scala и spark. Так что буду очень благодарен за помощь.
Проблема:
У меня есть HashMap, hMap1, значения которого представляют собой HashSets целочисленных записей (HashMap>). Затем я сохраняю его значения (т. е. многие значения HashSet) в RDD. Код приведен ниже
val rdd1 = sc.parallelize(Seq(hMap1.values()))
Теперь у меня есть другой HashMap, hMap2, того же типа, то есть HashMap>. Его значения также хранятся в RDD как
val rdd2 = sc.parallelize(Seq(hMap2.values()))
Я хочу знать, как мне пересечь значения hMap1 и hMap2
Например:
Ввод:
данные в rdd1 = [2, 3], [1, 109], [88, 17]
и данные в rdd2 = [2, 3], [1, 109], [5,45]
Вывод
поэтому вывод = [2, 3], [1, 109]