पर जेएसओएन संदेश से स्पार्क स्ट्रीमिंग में स्पार्क डेटाफ्रेम बनाएं, मैं स्कैला में स्पार्क स्ट्रीमिंग के कार्यान्वयन पर काम कर रहा हूं, जहां मैं एक कफका विषय से JSON स्ट्रिंग खींच रहा हूं और उन्हें डेटाफ्रेम में लोड करना चाहता हूं। क्या ऐसा करने का कोई तरीका है जहां स्पार्क आरडीडी [स्ट्रिंग] से स्वयं के स्कीमा का उल्लंघन करता है?कफका
sqlContext.read
//.schema(schema) //optional, makes it a bit faster, if you've processed it before you can get the schema using df.schema
.json(jsonRDD) //RDD[String]
मैं क्या करने की कोशिश कर रहा हूँ:
val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)
val yourDataFrame = hiveContext.createDataFrame(yourRDD)
यह निम्नलिखित प्रश्न के रूप में समान है: http: //stackoverflow.com/questions/29383578/how-to-convert-rdd-object-to-dataframe-in-spark – sparklearner