मान लें कि मेरे पास स्ट्रिंग्स की एक सूची है। मैं फ़िल्टर & उन्हें सॉर्ट करें, और परिणाम को ड्राइवर को इकट्ठा करें। हालांकि, चीजें वितरित की जाती हैं, और प्रत्येक आरडीडी के पास मूल सूची का अपना हिस्सा होता है। तो, स्पार्क अंतिम क्रमबद्ध क्रम कैसे प्राप्त करता है, क्या यह परिणाम विलय करता है?स्पार्क सॉर्ट ऑर्डर कैसे प्राप्त करता है?
6
A
उत्तर
3
स्पार्क में छंटाई एक अवस्थायाँ प्रक्रिया है जो की आवश्यकता है की उथल:
- इनपुट RDD नमूना और इस नमूने प्रत्येक उत्पादन विभाजन (
sample
collect
के बाद) - इनपुट RDD विभाजित है के लिए सीमाओं की गणना करने के लिए किया जाता है पहले चरण में गणना की सीमाओं के साथ
rangePartitioner
का उपयोग कर (partitionBy
) - दूसरे चरण से प्रत्येक विभाजन स्थानीय रूप से क्रमबद्ध किया जाता है (
mapPartitions
)
जब डेटा एकत्र किया जाता है तो विभाजनकर्ता द्वारा परिभाषित आदेश का पालन करना है।
से ऊपर चरणों स्पष्ट रूप से एक डिबग स्ट्रिंग में परिलक्षित होते हैं:
scala> val rdd = sc.parallelize(Seq(4, 2, 5, 3, 1))
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at ...
scala> rdd.sortBy(identity).toDebugString
res1: String =
(6) MapPartitionsRDD[10] at sortBy at <console>:24 [] // Sort partitions
| ShuffledRDD[9] at sortBy at <console>:24 [] // Shuffle
+-(8) MapPartitionsRDD[6] at sortBy at <console>:24 [] // Pre-shuffle steps
| ParallelCollectionRDD[0] at parallelize at <console>:21 [] // Parallelize
संबंधित मुद्दे
- 1. jqGrid डिफ़ॉल्ट सॉर्ट ऑर्डर?
- 2. सॉर्ट ऑर्डर कैसे सहेजते हैं?
- 3. सॉर्ट द्वारा परिवर्तन स्पार्क नौकरी क्यों ट्रिगर करता है?
- 4. डिफ़ॉल्ट सॉर्ट ऑर्डर
- 5. PostgreSQL: सॉर्ट ऑर्डर
- 6. एंड्रॉइड शेयर्डप्रिंट्स putStringSet ऑर्डर/सॉर्ट
- 7. Contentful.com एपीआई ऑर्डर/सॉर्ट क्वेरी
- 8. MySQL: सॉर्ट ऑर्डर "शो टैबलेट"
- 9. गिटहब विकी पेज सॉर्ट ऑर्डर?
- 10. सॉर्ट डिस्क्रिप्शन और स्वचालित सॉर्ट किए गए ऑर्डर रीफ्रेश
- 11. "ऑर्डर द्वारा ऑर्डर()" - यह कैसे काम करता है?
- 12. LINQ और एक प्राकृतिक सॉर्ट ऑर्डर
- 13. jqGrid - कॉलम द्वारा डिफ़ॉल्ट सॉर्ट ऑर्डर
- 14. अनुक्रमित करें nodejs में सभी सॉर्ट ऑर्डर
- 15. Riak में डेटा को सॉर्ट/ऑर्डर कैसे करें?
- 16. पैडोक-साइटप्रोक सॉर्ट उद्धरण कैसे करता है?
- 17. MapReduce सॉर्ट एल्गोरिदम कैसे काम करता है?
- 18. फ्लाईवे सॉर्ट संस्करण संख्या कैसे करता है?
- 19. स्पार्क में विभाजन कैसे काम करता है?
- 20. कैसे createOrReplaceTempView स्पार्क में काम करता है?
- 21. एसटीएल मानचित्र में सॉर्ट ऑर्डर करें और
- 22. सिम्फनी सिद्धांत ईगर और ऑर्डर प्राप्त करता है संयोजन संयोजन
- 23. सॉर्ट ऑर्डर को बदलना - [एनएसएआरएआरए सॉर्टेडएरेयू यूजिंगकंपेटर:]
- 24. Mailchimp दोहराने योग्य ब्लॉक सॉर्ट ऑर्डर रीसेट
- 25. जावा फॉर-प्रत्येक लूप: सॉर्ट ऑर्डर
- 26. स्पार्क स्ट्रीमिंग में इन-ऑर्डर प्रोसेसिंग
- 27. Kinesis स्पार्क स्ट्रीमिंग रिसीवर काम करता है
- 28. टीएसक्यूएल - क्या सॉर्ट ऑर्डर को परिभाषित करना संभव है?
- 29. ऑर्डर
- 30. विंडोज़ में जेड-ऑर्डर कैसे प्राप्त करें?