मैं क्लस्टर ssh
का उपयोग कर से कनेक्ट हूं और मैं क्लस्टर का उपयोग करक्लस्टर पर फ़ाइल सहेजने का कैसे
spark-submit --master yarn myProgram.py
मैं एक पाठ फ़ाइल में परिणाम सहेजना चाहते करने के लिए कार्यक्रम भेज सकते हैं और मैं उपयोग करने की कोशिश निम्नलिखित पंक्तियां:
counts.write.json("hdfs://home/myDir/text_file.txt")
counts.write.csv("hdfs://home/myDir/text_file.csv")
हालांकि, उनमें से कोई भी काम नहीं करता है। प्रोग्राम खत्म हो जाता है और मुझे myDir
में टेक्स्ट फ़ाइल नहीं मिल रही है। क्या आपको कोई विचार है कि मैं यह कैसे कर सकता हूं?
इसके अलावा, क्या मेरी स्थानीय मशीन पर सीधे लिखने का कोई तरीका है?
संपादित करें: मुझे पता चला कि home
निर्देशिका तो मौजूद नहीं है अब मैं के रूप में परिणाम को बचाने: counts.write.json("hdfs:///user/username/text_file.txt")
लेकिन इस text_file.txt
नाम के एक निर्देशिका बनाता है और अंदर मैं अंदर आंशिक परिणामों के साथ फ़ाइलों की एक बहुत कुछ है। लेकिन मुझे एक फ़ाइल अंतिम परिणाम के साथ चाहिए। कोई विचार मैं यह कैसे कर सकता हूं?
यह एक निर्देशिका एक फ़ाइल नहीं बना देता है, वैसे –
@ cricket_007 धन्यवाद मुझे पता नहीं था कि – lads
आप की 'HDFS DFS -LS HDFS उत्पादन दिखाने कृपया:// घर/myDir'? –