के आधार पर लगभग डुप्लिकेट पंक्तियां मर्ज करें मेरे पास pandas
डेटाफ्रेम है जो कई पंक्तियों के साथ एक दूसरे के डुप्लिकेट के पास है, एक मान को छोड़कर। मेरा लक्ष्य संख्यात्मक मानों को संक्षेप किए बिना, इन पंक्तियों को एक पंक्ति में विलय करना या "सहवास" करना है।पांडा - कॉलम मान
यहाँ है कि मैं क्या साथ काम कर रहा हूँ का एक उदाहरण है:
Name Sid Use_Case Revenue
A xx01 Voice, SMS $10.00
B xx02 Voice $5.00
C xx03 Voice, SMS, Video $15.00
कारण मैं "राजस्व योग करने के लिए नहीं करना चाहती:
Name Sid Use_Case Revenue
A xx01 Voice $10.00
A xx01 SMS $10.00
B xx02 Voice $5.00
C xx03 Voice $15.00
C xx03 SMS $15.00
C xx03 Video $15.00
और यहाँ मैं क्या चाहते हैं "कॉलम इसलिए है क्योंकि मेरी तालिका कई समय अवधि में एक पिवट करने का परिणाम है जहां" राजस्व "बस" Use_Case "प्रति अलग मूल्य रखने के बजाय कई बार सूचीबद्ध हो जाता है।
इस मुद्दे से निपटने का सबसे अच्छा तरीका क्या होगा? मैंने groupby()
फ़ंक्शन में देखा है लेकिन मुझे अभी भी यह बहुत अच्छी तरह से समझ में नहीं आया है।
यदि मेरा या अमी का उत्तर सहायक था, तो [स्वीकार करें] (http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work) को मत भूलना। धन्यवाद। – jezrael
धन्यवाद! वे दोनों अच्छी तरह से काम करते हैं। मुझे कुछ कॉलम मर्ज करना पड़ सकता है क्योंकि मेरा वास्तविक डेटासेट 4 प्रदान किए गए मुकाबले से काफी व्यापक है, लेकिन यह चाल –