Я пытаюсь сделать группу по агрегатам. Использование Spark 1.5.2
Подскажите, пожалуйста, почему это не работает.
in - это фрейм данных.
scala> in
res28: org.apache.spark.sql.DataFrame = [id: int, city: string]
scala> in.show
+---+--------+
| id| city|
+---+--------+
| 10|Bathinda|
| 20|Amritsar|
| 30|Bathinda|
+---+--------+
scala>in.groupBy("city").agg(Map{
| "id" -> "sum"
| }).show(true)
+----+-------+
|city|sum(id)|
+----+-------+
+----+-------+
Спасибо,
Я ожидаю, что на выходе должны быть города и сумма идентификаторов
РЕДАКТИРОВАТЬ: я не знаю, почему это сработало в следующий раз, когда я создал новую искровую оболочку
sc.parallelize(Seq((10, "Bathinda"), (20, "Amritsar"), (30, "Bathinda"))).toDF("id", "city").groupBy("city").agg(Map("id" -> "sum")).show
показывает такие же результаты? - person emeth   schedule 26.11.2015