У меня есть несколько объединений в последовательности в разных RDD, как показано ниже:
val result = rdd1 union rdd2 union rdd3 union rdd4
Будет ли Spark генерировать объединения последовательно (что равно O(n)), или Spark будет генерировать параллельный план (O(log(n))? То есть будет ли он выполнять rdd1 union rdd2
параллельно с rdd3 union rdd4
, а затем объединять результаты этих двух ?