2015-11-21 10 views
5

दोनों "स्पार्क-शैल" या "पिसपार्क" गोले में, मैंने कई आरडीडी बनाए लेकिन मुझे कोई रास्ता नहीं मिला जिसके माध्यम से मैं स्पार्क शैल के अपने वर्तमान सत्र में सभी उपलब्ध आरडीडी सूचीबद्ध कर सकता हूं?स्पार्क खोल में परिभाषित आरडीडी की सूची कैसे करें?

उत्तर

6

अजगर में आप बस प्रकार द्वारा फ़िल्टर करने globals कोशिश कर सकते हैं:

def list_rdds(): 
    from pyspark import RDD 
    return [k for (k, v) in globals().items() if isinstance(v, RDD)] 

list_rdds() 
# [] 

rdd = sc.parallelize([]) 
list_rdds() 
# ['rdd'] 

स्काला आरईपीएल में आप एक समान तरीके से $intp.definedTerms/$intp.typeOfTerm उपयोग करने के लिए सक्षम होना चाहिए।

+1

आरई: स्कैला आरपीएल: अच्छा काम करता है: अच्छी टिप। अब मैं उन आदेशों को कैसे याद करूं ..;) – javadba

+1

क्या आप समाधान @javadba पोस्ट कर सकते हैं? शायद @ शून्य323 के उत्तर पर विस्तार करें। –

+0

@JacekLaskowski मैंने कुछ ऐसा करने की कोशिश की है [यह] (https://gist.github.com/zero323/9da96f5c319c678ceef8) और यह काम करता है लेकिन यह हैकी के लिए बहुत दूर है (उल्लेख नहीं है कि स्कैला की समझ में मेरी पूरी कमी दिखाती है कंपाइलर) इसे एक उत्तर बनाने के लिए। – zero323

संबंधित मुद्दे