तो मैं पाइथन (Pyspark) का उपयोग कर स्पार्क सीखने की कोशिश कर रहा हूं। मैं जानना चाहता हूं कि फ़ंक्शन mapPartitions
कार्य कैसे करें। यही वह इनपुट है जो इसे लेता है और यह आउटपुट क्या देता है। मुझे इंटरनेट से कोई उचित उदाहरण नहीं मिला। आइए कहें, मेरे पास एक आरडीडी ऑब्जेक्ट है जिसमें सूचियां हैं, जैसे कि नीचे।pyspark mapPartitions कैसे कार्य करता है?
[ [1, 2, 3], [3, 2, 4], [5, 2, 7] ]
और मैं सभी सूचियों से तत्व 2 निकालना चाहते हैं, मैं कैसे प्राप्त होता है कि mapPartitions
का उपयोग कर।
आप फ़िल्टरऑट 2 फ़ार्मापार्टिशन एफ में कुछ भी क्यों नहीं लौटते अभिषेक हुआ। दूसरा, पाइथन में कुछ अंतिम शब्द है? मुझे लगता है कि आप Final_iterator के बजाय final.iterator = [] कहना चाहते थे। – MetallicPriest
समस्याओं को फिक्स्ड – bearrito
मैंने इसे कार्यान्वित करने का प्रयास किया लेकिन मुझे त्रुटि मिली "सूची वस्तु एक पुनरावर्तक नहीं है"। साथ ही, मुझे लगता है कि जब आपने लिखा था कि x x x में x x = = 2], तो मुझे लगता है कि आप का मतलब है [एक्स के लिए x में x x = = 2]। मैंने वहां सूची का इस्तेमाल किया। – MetallicPriest