Я пытаюсь создать приложение, используя искру apache, используя IBM bluemix. (Ссылка https://developer.ibm.com/clouddataservices/sentiment-analysis-of-twitter-hashtags/). Я использую потоковый API для потоковой передачи данных и успешно создал таблицу SQL, используя искровой SQL. Затем я прочитал данные, используя SQL select *, но когда я не могу записать данные в файл paraque в пространстве хранения объектов на платформе IBM Bluxmix. Ниже приведен пример кода.
.
.
.
var df = sqlContext.createDataFrame( workingRDD, schemaTweets )
df.registerTempTable("tweets_table")
df.printSchema()
root
|-- author: string (nullable = true)
|-- date: string (nullable = true)
|-- lang: string (nullable = true)
|-- text: string (nullable = true)
val results = sqlContext.sql("select * from tweets_table limit 5")
results.show
+--------------------+--------------------+----+--------------------+
| author| date|lang| text|
+--------------------+--------------------+----+--------------------+
| abc ?|Sun Nov 29 03:30:...| en|RT @fdfds: W........|
| fdsfsdf ?|Sun Nov 29 03:30:...| en|#NewsIndofsdfM R...|
| .fsdfdsf |Sun Nov 29 03:30:...| en|RT @Lsfddsfds. ..|
| Wsfsfd |Sun Nov 29 03:30:...| en|My gfsdfsdfdshtps...|
| Ffsdfsdf |Sun Nov 29 03:30:...| en|RT @Ayfsdfsdf : W...|
+---------------------+--------------------+----+--------------------+
results.repartition(1).saveAsParquetFile("swift://notebooks.spark/tweets_1.parquet")
Здесь в хранилище объектов видно, что файл tweets_1.parquet создан, но он отображается как 0 байт. Может ли кто-нибудь дать мне знать, где я сделал ошибку?
saveAsText
, будет ли файл пустым? - person Glennie Helles Sindholt   schedule 30.11.2015