मैं वर्तमान में 2 मिलियन से अधिक लाइनों वाली फ़ाइल के साथ काम कर रहा हूं। मैंने लाइनों को तत्वों की सूचियों में विभाजित कर दिया है (उदा: [a,b,c,d]
= 1 पंक्ति, शब्द अलग)। मैं 2 मिलियन + लाइनों का जिक्र कर रहा हूँपायथन लूप अनुकूलन
for a in aud:
for esps in final:
if a[0] in final[esps]:
a[0] = esps
पाश के लिए पहले में:
मैं सभी लाइनों के माध्यम से जाने के लिए निम्न कोड का उपयोग करने की कोशिश कर रहा हूँ। लूप के लिए दूसरे में यह 2010 कुंजी के साथ एक शब्दकोश के माध्यम से जाता है, संभवतः कम से कम 50 संबंधित मानों के साथ प्रत्येक कुंजी। मैं a[0]
तत्व को उन पंक्तियों में ढूंढना चाहता हूं जो शब्दकोश में मानों के बराबर हैं। यदि वे मेल खाते हैं, तो मैं चयनित लाइन में a[0]
तत्व को शब्दकोश की कुंजी के मान में बदलता हूं।
समस्या यह है कि इस कोड को चलाने के लिए उम्र लगती है और मुझे ऑप्टिमाइज़ेशन और इसे बहुत तेज़ चलाने के बारे में ज्यादा कुछ नहीं समझता है। यदि कोई मुझे बता सकता है कि इस तरह कुछ कैसे करना है तो मैं बहुत धन्यवाद करता हूं।
हम्म, तो आप सिर्फ एक कंप्यूटर तक ही सीमित कर रहे हैं? मुझे लगता है कि आप ऐसा करने के लिए कई श्रमिकों का उपयोग कर सकते हैं। एक कंप्यूटर के साथ भी, आप मल्टीकोर सीपीयू –
के साथ कई श्रमिक भी बना सकते हैं, इस विवरण को किसी भी उदाहरण डेटा के साथ आपकी वास्तविक समस्या को कम करना मुश्किल है। क्या "अंतिम" शब्दकोश स्ट्रिंग में से प्रत्येक में 50 कुंजी हैं? – jsbueno
क्या इस पर पुनरावृत्ति करते समय किसी ऑब्जेक्ट को म्यूट करने का दुष्प्रभाव नहीं होगा? – pylang