2017-07-06 16 views
6

मैं एक टसेपेल्लिन 0.7 नोटबुक में स्पार्क 2 और स्काला 2.11 उपयोग कर रहा हूँ। मैं एक dataframe कि मैं इस तरह मुद्रित कर सकते हैं है:मैं ज़ेपेल्लिन/स्पार्क/स्कैला में डेटा फ्रेम को कैसे प्रिंट कर सकता हूं?

dfLemma.select("text", "lemma").show(20,false) 

और उत्पादन की तरह दिखता है:

+---------------------------------------------------------------------------------------------------------------------------+-----------------------------------------------------------------------------------------------------------------------------------------------------------------------+ 
|text                              |lemma                                         | 
+---------------------------------------------------------------------------------------------------------------------------+-----------------------------------------------------------------------------------------------------------------------------------------------------------------------+ 
|RT @Dope_Promo: When you and your crew beat your high scores on FUGLY FROG https://time.com/Sxp3Onz1w8     |[rt, @dope_promo, :, when, you, and, you, crew, beat, you, high, score, on, FUGLY, FROG, https://time.com/sxp3onz1w8]              | 
|RT @axolROSE: Did yall just call Kermit the frog a lizard? https://time.com/wDAEAEr1Ay          |[rt, @axolrose, :, do, yall, just, call, Kermit, the, frog, a, lizard, ?, https://time.com/wdaeaer1ay]                  | 

मैं उत्पादन टसेपेल्लिन में अच्छे बनाने के लिए कोशिश कर रहा हूँ, द्वारा:

val printcols= dfLemma.select("text", "lemma") 
println("%table " + printcols) 

जो यह आउटपुट देता है:

printcols: org.apache.spark.sql.DataFrame = [text: string, lemma: array<string>] 

और एक नया खाली टसेपेल्लिन पैरा

[text: string, lemma: array] 

वहाँ एक ठीक से स्वरूपित तालिका के रूप में दिखाने के लिए dataframe होने का एक रास्ता है नेतृत्व में? टीआईए!

उत्तर

16

टसेपेल्लिन में आप z.show(df) का उपयोग एक सुंदर तालिका दिखाने के लिए कर सकते हैं। यहाँ एक उदाहरण है:

val df = Seq(
    (1,1,1), (2,2,2), (3,3,3) 
).toDF("first_column", "second_column", "third_column") 

z.show(df) 

enter image description here

+0

अच्छा लगा। इस बारे में अनजान होने के कारण, मैंने अपने स्वयं के सुंदर प्रिंट फ़ंक्शन (''% table'' का लाभ उठाने) को pyspark के लिए लिखा था। मैं दस्तावेज में यह कहीं भी नहीं मिल रहा है, फिर भी ... –

+1

@ TwUxTLi51Nus यह सच है डॉक्स इस हिस्से के लिए बहुत अच्छा नहीं कर रहे हैं। आप ZeppelinContext [यहां] के बारे में कुछ जानकारी मिल सकती है (https://zeppelin.apache.org/docs/latest/interpreter/spark.html#zeppelincontext) और कोड में ([यहां] (https://github.com /apache/zeppelin/blob/branch-0.7/spark/src/main/java/org/apache/zeppelin/spark/ZeppelinContext.java)) आप सभी उपलब्ध कार्यों देख सकते हैं। साथ ही, नोटबुक में आप z चर पर ctrl + space का उपयोग करके जांच सकते हैं। –

+0

ctrl + space मेरे लिए काम नहीं करता है, हालांकि (पायथन में) '' dir (z) '' करता है। –

संबंधित मुद्दे