पांडस डेटा विश्लेषण में उपयोग मामलों के बहुत व्यापक स्पेक्ट्रम को संबोधित करने में बहुत अच्छा है। एक विशेष कार्य करने का सबसे अच्छा तरीका क्या है यह जानने के लिए प्रलेखन की खोज करना थोड़ा मुश्किल हो सकता है।पांडा में मर्ज() और concat() के बीच अंतर
मैं वर्तमान में pd.DataFrame.merge()
और pd.concat()
के बीच आवश्यक अंतर को समझने की कोशिश कर रहा हूं। अब तक, मैं यह स्पष्ट कर सकता हूं:
.merge()
केवल कॉलम (प्लस पंक्तियों सूचकांक) का उपयोग कर सकते हैं और यह डेटाबेस-शैली संचालन के लिए अर्थात् उपयुक्त है। .concat()
केवल इंडेक्स का उपयोग करके धुरी के साथ प्रयोग किया जा सकता है, और एक पदानुक्रमित सूचकांक जोड़ने का विकल्प देता है।
संयोग से, यह निम्नलिखित अनावश्यकता की अनुमति देता है: दोनों पंक्तियों के सूचकांक का उपयोग करके दो डेटाफ्रेम जोड़ सकते हैं।
और pd.DataFrame.join()
के लिए, ऐसा लगता है कि यह केवल .merge()
के उपयोग मामलों के सबसेट के लिए एक शॉर्टेंड प्रदान करता है।
क्या कोई इस बात पर टिप्पणी कर सकता है कि इस समय मेरी समझ कितनी पूर्ण और सटीक है?
धन्यवाद।
इसके अलावा, संबंधित: http://stackoverflow.com/a/37891437/1972495 एक चर्चा के आसपास '' '' .merge() '' '' और '' '' .join() '' ''। – WindChimes