कैसे विभाजित करता है तो मान लें कि आईव 3000 पंक्तियों के साथ एक rdd मिला है। 2000 की पहली पंक्तियां कक्षा 1 के हैं और 1000 अंतिम पंक्तियां कक्षा 2 के हैं। आरडीडी 100 विभाजनों में विभाजित है।स्पार्क्स RDD.randomSplit वास्तव में आरडीडी
जब RDD.randomSplit(0.8,0.2)
बुला समारोह भी RDD शफ़ल करता है? हम विभाजन को बस 20% लगातार आरडीडी का नमूना देते हैं? या क्या यह विभाजन का 20% यादृच्छिक रूप से चुनता है?
आदर्श रूप से परिणामी विभाजन में मूल आरडीडी के समान वर्ग वितरण होता है। (अर्थात 2: 1)
धन्यवाद