में सरल क्रॉस-टैबलेशन मैंने pandas पर ठोकर खाई और यह सरल गणनाओं के लिए आदर्श लग रहा है जो मैं करना चाहता हूं। मेरे पास एक एसएएस पृष्ठभूमि है और यह सोच रहा था कि यह proc freq को प्रतिस्थापित करेगा - ऐसा लगता है कि यह भविष्य में जो करना चाहता है उससे स्केल करेगा। हालांकि, मुझे लगता है कि मेरे सिर को एक साधारण कार्य के आसपास नहीं लग रहा है (मुझे यकीन नहीं है कि मुझे pivot/crosstab/indexing
पर देखना है - चाहे मेरे पास Panel
या DataFrames
आदि हो ...)। किसी ने मुझे कैसे करना है पर कुछ संकेत दे सकता है निम्नलिखित:पांडा
मैं दो CSV फ़ाइलें (वर्ष 2010 के लिए एक, वर्ष 2011 के लिए एक - सरल लेनदेन डेटा) - राशि कॉलम श्रेणी और राशि
2010:
AB,100.00
AB,200.00
AC,150.00
AD,500.00
2011:
AB,500.00
AC,250.00
AX,900.00
ये अलग DataFrame वस्तुओं में लोड कर रहे हैं।
2010::
AB,300.00,2
AC,150.00,1
AD,500.00,1
2011:
AB,500.00,1
AC,250.00,1
AX,900.00,1
मैं क्या करना चाहते हैं क्या वर्ग, श्रेणी का योग है, और श्रेणी की आवृत्ति, जैसे मिलता है
मैं काम नहीं कर सकता कि मुझे pivot/crosstab/groupby/an index
आदि का उपयोग करना चाहिए ... मैं या तो योग या आवृत्ति प्राप्त कर सकता हूं - मुझे लगता है कि मैं दोनों को प्राप्त नहीं कर सकता ... यह थोड़ा और जटिल हो जाता है क्योंकि मैं इसे महीने के आधार पर एक महीने में करना चाहता हूं, लेकिन मुझे लगता है कि अगर कोई मुझे सही तकनीक/दिशा में इंगित करने के लिए बहुत दयालु होगा तो मैं वहां से जा सकूंगा।
तो क्या आप कह रहे हैं कि प्रत्येक '.csv' फ़ाइल केवल एक पंक्ति है, और उसके बाद उस पंक्ति में पहला मान उस वर्ष के बाद होता है जब आप इसे ऊपर प्रस्तुत करते हैं? – benjaminmgross
हाय फैक्टर 3, यही तरीका है कि एस/ओ ने इसे प्रारूपित करने का फैसला किया है (पहली बार मैंने इसका इस्तेमाल किया है, इसलिए भविष्य में इसके लिए देखना होगा) ... मुझे स्पष्टीकरण दें ... दो फाइलें हैं - 2010। सीएसवी और 2011.csv; इनमें 'एन' कई पंक्तियां होती हैं जिनमें से प्रत्येक में दो कॉलम होते हैं। मैं इस सवाल को सरल बनाने की कोशिश कर रहा था - लेकिन सहमत हूं कि स्वरूपण कुछ हद तक भ्रामक है कि मैंने इसे वापस पढ़ा है! –
मैंने इस [** क्यू एंड ए **] (https://stackoverflow.com/q/47152691/2336654) में कई विस्तृत उदाहरण और वैकल्पिक दृष्टिकोण प्रदान किए हैं जो आप या अन्य उपयोगी हो सकते हैं। – piRSquared