सामान्य उद्देश्य सॉर्टिंग के लिए, उत्तर त्वरित रूप से नहीं दिखता है, जैसे कि सॉर्ट और हीप सॉर्ट विलय औसत-और सबसे खराब स्थिति परिदृश्यों में बेहतर प्रदर्शन करते हैं। हालांकि, प्रविष्टि क्रमशः बढ़ते सॉर्टिंग पर एक्सेल करने के लिए प्रतीत होता है, यानी सूची को क्रमबद्ध रखते हुए एक विस्तारित अवधि के दौरान एक सूची में तत्व जोड़ना, विशेष रूप से अगर सम्मिलन प्रकार को एक लिंक्ड सूची के रूप में कार्यान्वित किया जाता है (ओ (लॉग एन) औसत मामला बनाम ओ (एन))। हालांकि, एक ढेर बढ़ता क्रमबद्ध करने के लिए (या लगभग) प्रदर्शन करने में सक्षम होने लगता है (एक ढेर से एक तत्व को जोड़ना या निकालना ओ (लॉग एन) का सबसे खराब-मामला परिदृश्य है)। तो सम्मिलन प्रकार को अन्य तुलना-आधारित सॉर्टिंग एल्गोरिदम या ढेर पर वास्तव में क्या करना है?क्या सम्मिलन सॉर्ट का उपयोग करने का कोई अच्छा कारण है?
उत्तर
http://www.sorting-algorithms.com/insertion-sort से:
हालांकि यह O (n) बुरी से बुरी हालत समय, साथ प्राथमिक सॉर्टिंग एल्गोरिदम में से एक है प्रविष्टि प्रकार पसंद के एल्गोरिथ्म है या तो डेटा मौजूद हो लगभग क्रमबद्ध (क्योंकि यह अनुकूली है) या जब समस्या का आकार छोटा है (क्योंकि इसमें ओवरहेड कम है)।
इन कारणों के लिए, और क्योंकि यह भी स्थिर है, प्रविष्टि प्रकार अक्सर पुनरावर्ती आधार मामले रूप में इस्तेमाल किया है इस तरह के रूप उच्च भूमि के ऊपर विभाजन और जीत छँटाई एल्गोरिदम, के लिए (जब समस्या आकार छोटा है) सॉर्ट या त्वरित सॉर्ट मर्ज करें।
आह, मैं स्थिरता के बारे में भूल गया ... मैंने वर्णित अन्य एल्गोरिदम में से कोई भी स्थिर नहीं है। –
+1। सम्मिलन प्रकार का आंतरिक पाश आधुनिक सीपीयू और कैश के लिए एक अच्छा फिट होने लगता है - यह एक बहुत तंग लूप है जो केवल बढ़ते क्रम में स्मृति का उपयोग करता है। –
खैर, क्विकॉर्ट को एक स्थिर प्रकार के रूप में कार्यान्वित किया जा सकता है, लेकिन चूंकि यह यादृच्छिक सेट के लिए इष्टतम है, मुझे लगता है कि कुशल qsort फ़ंक्शन सॉर्ट करने से पहले जानबूझकर डेटा को यादृच्छिक रूप से याद करते हैं। – guns
अधिकतर सॉर्टिंग प्रक्रियाएं बहुत छोटे डेटा सेट के लिए क्विकॉर्ट और फिर सम्मिलन प्रकार का उपयोग करेंगी।
एल्गोरिदम के विश्लेषण में एक महत्वपूर्ण अवधारणा asymptotic विश्लेषण है। विभिन्न एसिगिप्टिक चलने वाले समय के साथ दो एल्गोरिदम के मामले में, जैसे कि एक ओ (एन^2) और एक ओ (nlogn) क्रमशः सम्मिलन क्रम और क्विकॉर्ट के मामले में है, यह निश्चित नहीं है कि एक दूसरे की तुलना में तेज़ है ।
इस प्रकार के विश्लेषण के साथ महत्वपूर्ण भेद यह है कि पर्याप्त रूप से बड़े N के लिए, एक एल्गोरिदम दूसरे की तुलना में तेज़ होगा। ओ (nlogn) जैसे किसी शब्द को एल्गोरिदम का विश्लेषण करते समय, आप स्थिरांक छोड़ देते हैं। जब वास्तविक रूप से एल्गोरिदम के चलने का विश्लेषण करते हैं, तो उन स्थिरांक केवल छोटे एन की स्थितियों के लिए महत्वपूर्ण होंगे।
तो इसका क्या अर्थ है? इसका मतलब है कि कुछ छोटे एन के लिए, कुछ एल्गोरिदम तेजी से होते हैं। एंबेडेडगुरस.net से यह article सीमित स्थान (16k) और सीमित मेमोरी सिस्टम के मामले में विभिन्न सॉर्टिंग एल्गोरिदम चुनने पर एक दिलचस्प परिप्रेक्ष्य शामिल है। बेशक, आलेख संदर्भ केवल 20 पूर्णांक की एक सूची को क्रमबद्ध करता है, इसलिए एन के बड़े आदेश अप्रासंगिक हैं। छोटे कोड और कम स्मृति खपत (साथ ही साथ रिकर्सन से परहेज) अंततः अधिक महत्वपूर्ण निर्णय थे।
सम्मिलन प्रकार कम ओवरहेड है, इसे काफी संक्षेप में लिखा जा सकता है, और इसमें कई दो प्रमुख लाभ हैं: यह स्थिर है, और जब इनपुट लगभग सॉर्ट किया जाता है तो इसका तेजी से चलने वाला मामला होता है।
यदि आप एक क्रमबद्ध सूची बनाए रखने के बारे में बात कर रहे हैं, तो किसी प्रकार के पेड़ पर कोई फायदा नहीं होता है, यह धीमा है।
अच्छा, शायद यह कम स्मृति का उपभोग करता है या एक सरल कार्यान्वयन है।
एक हल कर सूची में सम्मिलित करना एक स्कैन, जिसका अर्थ है कि प्रत्येक डालने हे (एन) है शामिल होगी, इसलिए n आइटम छँटाई O (n^2)
एक कंटेनर में सम्मिलित करना इस तरह के एक संतुलित पेड़ के रूप में हो जाता है, आम तौर पर लॉग (एन) है, इसलिए क्रम ओ (एन लॉग (एन)) है जो निश्चित रूप से बेहतर है।
लेकिन छोटी सूचियों के लिए यह शायद ही कोई फर्क पड़ता है। यदि आप किसी भी पुस्तकालय के बिना इसे स्वयं लिखना चाहते हैं, तो आप एक सम्मिलित सॉर्ट का उपयोग कर सकते हैं, सूचियां छोटी हैं और/या आपको प्रदर्शन की परवाह नहीं है।
हाँ,
निवेशन तरह से कम सूचियों पर त्वरित क्रमबद्ध बेहतर है।
वास्तव में एक इष्टतम त्वरित सॉर्ट में आकार सीमा होती है जो यह बंद हो जाती है, और फिर संपूर्ण सरणी को थ्रेसहोल्ड सीमाओं पर सम्मिलन प्रकार द्वारा क्रमबद्ध किया जाता है।
भी ...
एक स्कोरबोर्ड को बनाए रखने के लिए, बाइनरी निवेशन क्रमबद्ध रूप में यह हो जाता है के रूप में अच्छा हो सकता है।
this page देखें।
"स्कोरबोर्ड" धारणा, जहां वस्तुओं को एक समय में उपलब्ध कराया जाता है, मुझे उस स्थिति के "दोहरी" की याद दिलाता है, जहां वस्तुओं को एक समय में एक तरह से वापस करने की आवश्यकता होती है (चयन प्रकार के साथ)। मैंने एक एनएलजीएन सॉर्ट किया है जो पहले तत्व को पहले देता है, दूसरा तत्व दूसरा, आदि। बुककीपिंग ओवरहेड बहुत डरावना है, लेकिन तुलना की संख्या पुस्तकालय qsort() से छोटी है जिसके खिलाफ मैंने इसे बेंचमार्क किया है। एक के स्कोर के साथ प्राथमिक पूल में सभी नोड्स के साथ शुरू करें। प्राथमिक पूल से सबसे कम स्कोर के साथ दो आइटम दोहराएं और उन्हें तुलना करें ... – supercat
... प्राथमिक स्कोर में "विजेता" को वापस रखकर, हारने वाले के स्कोर को अपने आप में जोड़ा गया, और "रिजर्व" में हारने वाला अपने स्कोर के साथ पूल unmodified। प्राथमिक पूल में एक तत्व होने तक जारी रखें। वह तत्व सबसे अच्छा है, इसलिए इसे आउटपुट करें, और उन सभी तत्वों को प्राथमिक पूल में ले जाएं जिनके खिलाफ विजेता तत्व की तुलना की गई थी। फिर प्राथमिक पूल से वस्तुओं को पहले तक ले जाना शुरू करें जब तक कि केवल एक ही बाएं (दूसरी सबसे अच्छी वस्तु) न हो। किसी भी समय, आरक्षित पूल में प्रत्येक आइटम प्राथमिक पूल में कम से कम एक आइटम से कम होगा, और प्राथमिक पूल में कोई आइटम नहीं ... – supercat
... पूल में किसी और चीज़ से कम होना चाहिए । हालांकि प्राथमिक पूल इसमें सभी एन वस्तुओं के साथ शुरू होगा, बाद में पास केवल उन वस्तुओं को शामिल करता है जिनके खिलाफ "विजेता" की तुलना की गई थी, इसलिए पहले के बाद वस्तुओं को आउटपुट करना उचित रूप से तेज़ होगा। – supercat
हां, एक प्रविष्टि प्रकार या इसके रूपों में से एक का उपयोग करने का एक कारण है।
अन्य उत्तरों के सॉर्टिंग विकल्प (त्वरित क्रम, आदि) इस धारणा को मानते हैं कि डेटा पहले से ही स्मृति में है और जाने के लिए तैयार है।
लेकिन यदि आप धीमे बाहरी स्रोत (हार्ड ड्राइव कहें) से बड़ी मात्रा में डेटा में पढ़ने का प्रयास कर रहे हैं, तो वहां बड़ी मात्रा में बर्बाद हो गया है क्योंकि बाधा स्पष्ट रूप से डेटा चैनल या ड्राइव है। यह सिर्फ सीपीयू के साथ नहीं रह सकता है। किसी भी पढ़ने के दौरान इंतजार की एक प्राकृतिक श्रृंखला होती है। ये प्रतीक्षा करता है बर्बाद CPU चक्र जब तक आप उन्हें तरह करने के लिए उपयोग के रूप में तुम जाओ हैं।
उदाहरण के लिए, यदि आप बनाने के लिए थे, वे इस के लिए अपने समाधान हो निम्नलिखित:
- स्मृति में एक समर्पित पाश में डेटा की एक टन पढ़ें
- क्रमबद्ध कि डेटा
आप यदि आपने दो धागे में निम्नलिखित किया है तो उससे अधिक समय लगेगा।
थ्रेड एक:
- एक गृहीत फीफो कतार में
- प्लेस गृहीत पढ़ें
- (दोहराएँ जब तक ड्राइव से थक डेटा)
थ्रेड बी:
- फीफो कतार से एक डाटाम प्राप्त करें
- अपने अनुसार क्रमबद्ध सूची में उचित जगह में डालने
- (कतार खाली जब तक दोहराने और धागा ए का कहना है "हो गया")।
... उपर्युक्त आपको अन्यथा बर्बाद समय का उपयोग करने की अनुमति देगा। नोट: थ्रेड बी थ्रेड ए की प्रगति में बाधा नहीं डालता है।
जब तक डेटा पूरी तरह से पढ़ा जाता है, तो इसे क्रमबद्ध और उपयोग के लिए तैयार किया जाएगा।
एल्गोरिदम के विश्लेषण में एक महत्वपूर्ण अवधारणा एसिम्प्टोटिक विश्लेषण है। विभिन्न एसिगिप्टिक चलने वाले समयों के साथ दो एल्गोरिदम के मामले में, जैसे कि एक ओ (एन^2) और एक ओ (nlogn) क्रमशः सम्मिलन क्रम और क्विकॉर्ट के मामले में होता है, यह निश्चित नहीं है कि एक दूसरे की तुलना में तेज़ है।
इस तरह के विश्लेषण के साथ महत्वपूर्ण भेद यह है कि पर्याप्त रूप से बड़े एन के लिए, एक एल्गोरिदम दूसरे की तुलना में तेज़ होगा। ओ (nlogn) जैसे किसी शब्द को एल्गोरिदम का विश्लेषण करते समय, आप स्थिरांक छोड़ देते हैं। जब वास्तविक रूप से एल्गोरिदम के चलने का विश्लेषण करते हैं, तो उन स्थिरांक केवल छोटे एन की स्थितियों के लिए महत्वपूर्ण होंगे।
तो इसका क्या अर्थ है? इसका मतलब है कि कुछ छोटे एन के लिए, कुछ एल्गोरिदम तेजी से होते हैं। एंबेडेडगुरस.net से इस आलेख में सीमित स्थान (16k) और सीमित मेमोरी सिस्टम के मामले में विभिन्न सॉर्टिंग एल्गोरिदम चुनने पर एक दिलचस्प परिप्रेक्ष्य शामिल है। बेशक, आलेख संदर्भ केवल 20 पूर्णांक की एक सूची को क्रमबद्ध करता है, इसलिए एन के बड़े आदेश अप्रासंगिक हैं। छोटे कोड और कम स्मृति खपत (साथ ही साथ रिकर्सन से परहेज) अंततः अधिक महत्वपूर्ण निर्णय थे।
सम्मिलन प्रकार कम ओवरहेड है, इसे काफी संक्षेप में लिखा जा सकता है, और इसमें कई दो प्रमुख लाभ हैं: यह स्थिर है, और जब इनपुट लगभग सॉर्ट किया जाता है तो इसका तेजी से चलने वाला मामला होता है।
छोटे सरणी सम्मिलन क्रम के लिए quicksort से तेज़ प्रदर्शन करता है। जावा 7 और जावा 8 आदिम डेटा प्रकारों को क्रमबद्ध करने के लिए दोहरी पिवट क्विकॉर्ट का उपयोग करता है। दोहरी पिवट Quicksort बाहर ठेठ एकल पिवट Quicksort प्रदर्शन करता है। दोहरे धुरी quicksort के एल्गोरिथ्म के अनुसार:
- छोटे सरणियों के लिए (लंबाई < 27), निवेशन तरह एल्गोरिथ्म का उपयोग करें।
- दो धुरी चुनें ...........
Definetely तरह बाहर सम्मिलन छोटे सरणियों के लिए quicksort करता है और यही वजह है कि आप लंबाई की सरणियों के लिए प्रविष्टि प्रकार के स्विच कर रहे हैं कम से कम 27। कारण सम्मिलन क्रम में कोई रिकर्स नहीं हो सकता है।
स्रोत: http://codeblab.com/wp-content/uploads/2009/09/DualPivotQuicksort.pdf
- 1. क्या असुरक्षितफॉर्मियो का उपयोग करने का कोई अच्छा कारण है?
- 2. क्या System.Uri का उपयोग करने का कोई कारण है?
- 3. क्या एकाधिक सम्मिलन कथन का उपयोग करते हुए SCOPE_IDENTITY का उपयोग करने का कोई तरीका है?
- 4. एक्शनस्क्रिप्ट: क्या 'कास्टिंग' का उपयोग करने का कोई अच्छा कारण है?
- 5. क्या इसका उपयोग करने का कोई कारण है->
- 6. क्या सख्त उपयोग करने से पहले चेतावनियों का उपयोग करने का कोई कारण है?
- 7. जावा में "प्रिंट" के बजाय "printf" का उपयोग करने का कोई अच्छा कारण है?
- 8. जेएस डबल विस्मयादिबोधक - क्या इसका उपयोग करने का कोई अच्छा कारण है?
- 9. क्या यूनिट लागू करने वाले प्रकारों का उपयोग न करने का कोई कारण है?
- 10. क्या जेएसपी टैग में <rtexprvalue> झूठी</ rtexprvalue> का उपयोग करने का कोई अच्छा कारण है?
- 11. क्या कोई अच्छा कारण है कि स्ट्रिंग के विपरीत यूनिकोड का उपयोग न करें?
- 12. क्या सभी वर्ण पढ़ने के दौरान InputStreamReader पर BufferedReader का उपयोग करने का कोई कारण है?
- 13. क्या 'संरक्षित' गुणों का उपयोग न करने का कोई कारण है?
- 14. क्या मिश्रित कोड प्रोजेक्ट में groovyc पर javac का उपयोग करने का कोई कारण है?
- 15. क्या किसी खंड में 1 = 1 का उपयोग करने का कोई तार्किक कारण है?
- 16. क्या थ्रेडिंग का उपयोग करने का कोई कारण है। मल्टीप्रोसेसिंग पर लॉक करें। लॉक?
- 17. क्या JSON कुंजी के लिए उद्धृत तारों का उपयोग करने का कोई व्यावहारिक कारण है?
- 18. क्या एनयूनीट के साथ AssertionHelper का उपयोग करने का कोई कारण नहीं है?
- 19. क्या पीडी-विस्तारित के बजाय वेनिला शुद्ध डेटा का उपयोग करने का कोई कारण है?
- 20. क्या <=> (शून्य सुरक्षित ऑपरेटर बराबर ऑपरेटर) का उपयोग करने के कारण mysql में = का उपयोग करने का कोई कारण नहीं है?
- 21. क्या यूटीसी में समय स्टोर करने का कोई अच्छा कारण नहीं है?
- 22. क्या जीटीके विजेट कॉपी करने का कोई अच्छा तरीका है?
- 23. क्विकॉर्ट और सम्मिलन सॉर्ट हाइब्रिड अपेक्षित चलने का समय
- 24. टाइपकिट का उपयोग न करने के कारण?
- 25. क्या डेटाबेस कारण के लिए किसी इंडेक्स पर auto_increment का उपयोग करने का कोई कारण नहीं है?
- 26. पासवर्ड हैशिंग के लिए क्या उपयोग करें? JBCrypt का उपयोग न करने का कोई कारण नहीं है?
- 27. क्या ऑब्जेक्ट इनिशिलाइज़र का उपयोग करने का कोई फायदा है?
- 28. दो तारों को जोड़ने के लिए '+' का उपयोग न करने का कोई कारण नहीं है?
- 29. libpurple का उपयोग करने का अच्छा उदाहरण?
- 30. एफएफ को SSL_ERROR_BAD_MAC_READ का उत्पादन करने का कारण क्या है?
आप इस तरह के एक हार्ड ड्राइव के रूप में एक अपेक्षाकृत धीमी बाहरी स्रोत से डेटा की एक बड़ी राशि में लोड कर रहे हैं, तो यह का उपयोग करने के एक प्रकार के रूप में यू-गो एल्गोरिथ्म का उपयोग करने के लिए अक्सर बेहतर है एक सीपीयू में शामिल बर्बाद चक्र ड्राइव को पकड़ने की प्रतीक्षा कर रहे हैं। [नीचे मेरा जवाब देखें] (http://stackoverflow.com/a/30193315/4229245)। –