मेरे पास 2 स्पष्ट चर, और आईडी चर और एक लक्षित चर (वर्गीकरण के लिए) के साथ एक पांडस डेटाफ्रेम है। मैं OneHotEncoder
के साथ विशिष्ट मानों को परिवर्तित करने में कामयाब रहा। इसका परिणाम एक स्पैर मैट्रिक्स में होता है।sklearn में OneHotEncoder से आउटपुट का उपयोग कैसे करें?
ohe = OneHotEncoder()
# First I remapped the string values in the categorical variables to integers as OneHotEncoder needs integers as input
... remapping code ...
ohe.fit(df[['col_a', 'col_b']])
ohe.transform(df[['col_a', 'col_b']])
लेकिन मैं कोई सुराग नहीं कैसे मैं एक DecisionTreeClassifier में यह विरल मैट्रिक्स का उपयोग कर सकते है? विशेष रूप से जब मैं बाद में अपने डेटाफ्रेम में कुछ अन्य गैर-वर्गीकृत चर जोड़ना चाहता हूं। धन्यवाद!
संपादित miraculixx की टिप्पणी करने के लिए जवाब में: मैं भी DataFrameMapper sklearn-पांडा में
mapper = DataFrameMapper([
('id_col', None),
('target_col', None),
(['col_a'], OneHotEncoder()),
(['col_b'], OneHotEncoder())
])
t = mapper.fit_transform(df)
की कोशिश की लेकिन तब मैं इस त्रुटि मिलती है:
TypeError: no supported conversion for types : (dtype('O'), dtype('int64'), dtype('float64'), dtype('float64')).
[sklearn-pandas] (https://github.com/paulgb/sklearn-pandas) डेटाफ्रेम और स्केलर के साथ काम करते समय वास्तव में सहायक होता है। – miraculixx