2017-04-07 15 views
5

मैं एक हाइव टेबल से डुप्लिकेट रिकॉर्ड हटाने के बारे में जानने की कोशिश कर रहा हूं।हाइव टेबल से डुप्लिकेट रिकॉर्ड कैसे हटाएं?

मेरे हाइव तालिका: स्तंभों के साथ 'dynpart': आईडी, नाम, प्रौद्योगिकी

Id Name Technology 
1 Abcd Hadoop 
2 Efgh Java 
3 Ijkl MainFrames 
2 Efgh Java 

हम एक का चयन क्वेरी में उपयोग करने के लिए 'अलग' है, लेकिन एक का चयन क्वेरी सिर्फ तालिका से डेटा को पुन: प्राप्त जैसे विकल्प हैं । कोई भी बता सकता है कि एक हाइव टेबल से डुप्लिकेट पंक्तियों को हटाने के लिए डिलीट क्वेरी का उपयोग कैसे करें।

सुनिश्चित करें कि यह अनुशंसित नहीं है या हाइव में रिकॉर्ड्स अपडेट/अपडेट करने के मानक नहीं है। लेकिन मैं सीखना चाहता हूं कि हम इसे कैसे करते हैं।

उत्तर

14

आप डालने का उपयोग कर सकते बयान के ऊपर लिख अद्यतन करने के लिए डेटा

insert overwrite table dynpart select distinct * from dynpart; 
+0

किया गया कोई अन्य तरीका है जहां हमें पूरी तालिका को हटाने और रिकॉर्ड हटाने की आवश्यकता नहीं है – salmanbw

3

आप किसी अन्य तालिका में विशिष्ट रिकॉर्ड सम्मिलित कर सकते हैं

create table temp as select distinct * from dynpart 
+1

या नई तालिका के बिना: 'dynpart से सम्मिलित अधिलेखित तालिका अलग चयन dynpart * ' – fi11er

+0

@ fi11er, आपका उत्तर काम कर रहा है। यदि आप अपनी टिप्पणी को उत्तर में डाल सकते हैं, तो मैं इसे स्वीकार करूंगा। – Sidhartha

+0

@ सिद्धार्थ, – fi11er

संबंधित मुद्दे