В этой строке какой RDD сохраняется? dropResultsN или dataSetN?
dropResultsN = dataSetN.map(s -> standin.call(s)).persist(StorageLevel.MEMORY_ONLY());
Вопрос возникает как побочная проблема из-за время Apache Spark для каждой операции на JavaRDD , где я все еще ищу хороший ответ на основной вопрос о том, как лучше всего рассчитать время создания RDD.