परीक्षण करने के लिए कैसे .repartition()
काम करता है, मैं निम्नलिखित कोड भाग गया:स्पार्क में समान रूप से पुन: विभाजन कैसे करें?
rdd = sc.parallelize(range(100))
rdd.getNumPartitions()
rdd.getNumPartitions()
4
में हुई। तब मैं भाग गया:
rdd = rdd.repartition(10)
rdd.getNumPartitions()
rdd.getNumPartitions()
इस समय 10
में हुई है, इसलिए वहां अब 10 विभाजन थे।
हालांकि, मैं द्वारा विभाजन की जाँच:
rdd.glom().collect()
परिणाम 4 गैर खाली सूचियों और 6 खाली सूचियों दे दी है। अन्य 6 सूचियों में कोई तत्व वितरित क्यों नहीं किया गया है?
स्पार्क का कौन सा संस्करण का उपयोग करते हैं से पढ़ा कहना के लिए? – zero323
संस्करण 1.6.1, मुझे विश्वास है। – cshin9