मुझे v0.15 + में पांडस के बेहतर वर्गीकरणों के साथ काम करने के लिए एक साधारण प्रकार की टाइपिंग प्रतीत नहीं हो रही है। असल में मैं बस is_categorical(column) -> True/False
की तरह कुछ चाहता हूँ।जांचें कि डेटाफ्रेम कॉलम स्पष्ट है
import pandas as pd
import numpy as np
import random
df = pd.DataFrame({
'x': np.linspace(0, 50, 6),
'y': np.linspace(0, 20, 6),
'cat_column': random.sample('abcdef', 6)
})
df['cat_column'] = pd.Categorical(df2['cat_column'])
हम देख सकते हैं कि स्पष्ट स्तंभ के लिए dtype
'श्रेणी' है:
df.cat_column.dtype
Out[20]: category
और सामान्य रूप से हम सिर्फ नाम dtype की करने की तुलना द्वारा एक dtype जांच कर सकते हैं:
df.x.dtype == 'float64'
Out[21]: True
लेकिन यह जांचने की कोशिश करते समय काम नहीं लगता है कि x
कॉलम स्पष्ट है:
df.x.dtype == 'category'
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-22-94d2608815c4> in <module>()
----> 1 df.x.dtype == 'category'
TypeError: data type "category" not understood
वहाँ में पांडा v0.15 + चेकों के इन प्रकार करने के लिए कोई रास्ता नहीं है?
, का चयन करने के लिए कॉलम> = 0.15.0 canoncial तरह से '' ' – Jeff
यह शायद करने के लिए है' df.select_dtypes (= [ 'श्रेणी'] शामिल हैं) तथ्य टी के साथ टोपी 'श्रेणी' एक डेटा प्रकार है जो पांडा द्वारा जोड़ा गया है, अन्य डेटा प्रकारों की तुलना में जो numpy से आता है। –