से डुप्लिकेट कॉलम और पंक्तियों को हटा रहा है मैं अक्षांश जोड़े (अक्षांश) के जोड़े को स्टोर करने के लिए 2 डी आकार सरणी का उपयोग कर रहा हूं। एक बिंदु पर, मुझे इन 2 डी सरणी में से दो को मर्ज करना होगा, और फिर किसी भी डुप्लीकेट प्रविष्टि को हटा देना होगा। मैं numpy.unique के समान फ़ंक्शन खोज रहा हूं, लेकिन मुझे कोई भाग्य नहीं मिला है। कोई भी कार्यान्वयन मैं पर बहुत "अनौपचारिक" दिखने पर सोच रहा हूं। उदाहरण के लिए, मैं, tuples की एक सूची के लिए सरणी परिवर्तित सेट के साथ डुप्लिकेट हटाने, और फिर एक सरणी के लिए फिर से परिवर्तित करने के साथ कोशिश कर रहा हूँ: वहाँ किसी भी मौजूदा समाधानएक NumPy 2D सरणी
coordskeys = np.array(list(set([tuple(x) for x in coordskeys])))
हैं, तो मैं पहिया बदलने नहीं है ? मैं बस इसके लिए tuples की एक सूची का उपयोग करना चाहता
>>> a = np.array([[1, 1], [2, 3], [1, 1], [5, 4], [2, 3]])
>>> unique_rows(a)
array([[1, 1], [2, 3],[5, 4]])
Btw,, लेकिन सूचियों इतना बड़ा है कि वे मेरी 4GB RAM + 4Gb भस्म थे:
यह स्पष्ट है, मैं तलाश कर रहा हूँ करने के लिए स्वैप (numpy arrays अधिक मेमोरी कुशल हैं)।
देखें http://stackoverflow.com/questions/7989722/finding-unique-points-in-numpy-array – joris