2016-02-08 4 views
5

मैं पाइथन और पांडा दोनों के लिए नया हूं, यदि यह एक मूर्ख सवाल है तो मेरे साथ इतना बेकार है। मैं बस एक कॉलम में एक निश्चित मूल्य प्रकट होने की संख्या को खोजने की कोशिश कर रहा हूं।पायथन पांडस एक विशिष्ट मूल्य के अवसरों की गणना

मैं data = pd.DataFrame.from_csv('data/DataSet2.csv')

साथ dataframe बना दिया है और अब मैं कुछ एक कॉलम में दिखाए जाने की लगाना चाहते हैं। यह कैसे किया जाता है?

मैंने सोचा कि यह नीचे था, जहां मैं शिक्षा कॉलम में देख रहा हूं और ? समय की गणना कर रहा हूं।

नीचे कोड से पता चलता है कि मैं 9th दिखाए जाने की खोजने की कोशिश कर रहा हूँ और त्रुटि जब मैं कोड को चलाने मैं क्या हो रही है है

कोड

missing2 = df.education.value_counts()['9th'] 
print(missing2) 

त्रुटि

KeyError: '9th' 
+0

'df.education.value_counts() का उपयोग कर [ '?']' सही होना चाहिए । इसके बजाय आपको क्या देता है? (कुछ कोड और वास्तविक आउटपुट दिखाएं) – joris

+0

प्रश्न – JJSmith

+0

को अपडेट किया गया हो सकता है कि आपको 'प्रिंट df [df.education ==' 9th '] की आवश्यकता हो। गिनती() ' – jezrael

उत्तर

6

IIUC आपबना सकते हैं shape या len अपनी हालत के साथ डेटा का +६००१८२३२१० और उसके बाद का उपयोग करें:

print df 
    col1 education 
0 a  9th 
1 b  9th 
2 c  8th 

print df.education == '9th' 
0  True 
1  True 
2 False 
Name: education, dtype: bool 

print df[df.education == '9th'] 
    col1 education 
0 a  9th 
1 b  9th 

print df[df.education == '9th'].shape[0] 
2 
print len(df['education'] == '9th') 
2 
2

तरीकों की युगल count या sum

In [338]: df 
Out[338]: 
    col1 education 
0 a  9th 
1 b  9th 
2 c  8th 

In [335]: df.loc[df.education == '9th', 'education'].count() 
Out[335]: 2 

In [336]: (df.education == '9th').sum() 
Out[336]: 2 

In [337]: df.query('education == "9th"').education.count() 
Out[337]: 2 
संबंधित मुद्दे