मेरे पास mongodb में एक बड़ा संग्रह (~ 2.7 मिलियन दस्तावेज़) है, और बहुत सारे डुप्लिकेट हैं। मैंने संग्रह पर ensureIndex({id:1}, {unique:true, dropDups:true})
चलाने का प्रयास किया। too many dups on index build with dropDups=true
का फैसला करने से पहले मोंगो थोड़ी देर के लिए इसे दूर कर देता है।मैं MongoDb में डुप्लीकेट कैसे हटा सकता हूं?
मैं इंडेक्स कैसे जोड़ सकता हूं और डुप्लिकेट से छुटकारा पा सकता हूं? या दूसरी तरफ, कुछ डुप्लिकेट को हटाने का सबसे अच्छा तरीका क्या है ताकि मोंगो सफलतापूर्वक इंडेक्स बना सके?
बोनस अंक के लिए, डुप्लिकेट की संख्या को सीमित क्यों किया जा सकता है?
एक विकल्प के रूप में: प्रत्येक आईडी के लिए एक मानचित्र चलाएं/उस गणना को कम करें। फिर इस परिणाम को चलाएं और डुप्लीकेट के साथ प्रत्येक 'आईडी' के लिए सभी रिकॉर्ड हटाएं लेकिन पहले। –