Имам RDD колекции от вектори, където всеки вектор представлява точка с x
и y
координати. Например файлът е както следва:
1.1 1.2
6.1 4.8
0.1 0.1
9.0 9.0
9.1 9.1
0.4 2.1
чета го:
def parseVector(line: String): Vector[Double] = {
DenseVector(line.split(' ')).map(_.toDouble)
}
val lines = sc.textFile(inputFile)
val points = lines.map(parseVector).cache()
Освен това имам епсилон:
val eps = 2.0
За всяка точка искам да намеря нейните съседи, които са в рамките на епсилон разстояние. Правя го:
points.foreach(point =>
// squaredDistance(point, ?) what should I write here?
)
Как мога да обвържа всички точки и за всяка точка да намеря нейните съседи? Вероятно използвате функцията map
?