को देखते हुए एक सरल CSV फ़ाइल है:RandomForestClassfier.fit(): ValueError: कनवर्ट नहीं कर सके फ्लोट करने के लिए स्ट्रिंग
A,B,C
Hello,Hi,0
Hola,Bueno,1
जाहिर असली डाटासेट में कहीं अधिक इस से जटिल है, लेकिन यह एक त्रुटि reproduces। मैं इतना है कि यह के लिए एक यादृच्छिक वन वर्गीकारक का निर्माण करने का प्रयास कर रहा हूँ:
cols = ['A','B','C']
col_types = {'A': str, 'B': str, 'C': int}
test = pd.read_csv('test.csv', dtype=col_types)
train_y = test['C'] == 1
train_x = test[cols]
clf_rf = RandomForestClassifier(n_estimators=50)
clf_rf.fit(train_x, train_y)
लेकिन मैं सिर्फ इस ट्रैस बैक जब लागू मिल फिट():
ValueError: could not convert string to float: 'Bueno'
scikit सीखने संस्करण 0.16.1 है ।
धन्यवाद। अंततः मुझे डिक्टिवेटोरिज़र का उपयोग करके एक समाधान मिला। मुझे आश्चर्य है कि इस तरह के मुद्दों से निपटने के बेहतर दस्तावेज नहीं हैं। अगर मैं यहाँ पर्याप्त कर्म था तो मैं ऊपर उठ जाऊंगा। – nilkn