मेरे पास कुछ पायथन स्क्रिप्ट हैं जहां मैं एक शब्दकोश में 5-10 मिलियन स्ट्रिंग कुंजी मान जोड़े संग्रहीत कर रहा हूं और मैं इस शब्दकोश को लगभग 5-10 मिलियन बार पूछता हूं। मैंने देखा कि पायथन dict बहुत अच्छा प्रदर्शन नहीं कर रहा है। स्ट्रिंग कुंजी के लिए सबसे अच्छा कोई अन्य कार्यान्वयन उपयुक्त है।पायथन: सर्वश्रेष्ठ शब्दकोश कार्यान्वयन
संपादित करें:
मैं उस व्यक्ति के नाम के दो बड़े सूचियों कर रहा हूँ और मैं उन्हें मिलान करना चाहते हैं, तो मैं संदर्भ सूची के रूप में उनमें से एक लेते हैं और यह पता लगाने की दूसरी सूची में प्रत्येक नाम पर अलग-अलग शोध प्रणालियों को लागू करने की कोशिश अगर वह पहली सूची में मौजूद है। इसलिए, मुझे दूसरी सूची में प्रत्येक नाम के लिए पहली बार 2-3 बार पूछताछ करना है। उम्मीद है, यह समझ में आता है।
आप डेटाबेस का उपयोग क्यों नहीं कर रहे हैं? – Geo
डाटाबेस कोई मतलब नहीं है। – Boolean
मुझे विश्वास करना मुश्किल लगता है कि फिर शब्दकोश लुकअप बाधाएं हैं।पाइथन शब्दकोश तेज़ हैं, और ऐसे मामले के लिए अनुकूलन भी हैं जहां सभी चाबियाँ तार हैं। क्या आप निश्चित हैं कि 'विभिन्न हेरिस्टिक' लागू करने का समय नहीं लिया जा रहा है? क्या आपने शब्दकोश लुकअप के साथ और बिना बेंचमार्क किया है? – Duncan