में त्रुटि मैं ट्रेन और परीक्षण सेट पर यादृच्छिक वन वर्गीकरण करने के लिए निम्न कोड पर काम कर रहा हूं;"बदले में 1 कॉलम ..." numpy
from sklearn.ensemble import RandomForestClassifier
from numpy import genfromtxt, savetxt
def main():
dataset = genfromtxt(open('filepath','r'), delimiter=' ', dtype='f8')
target = [x[0] for x in dataset]
train = [x[1:] for x in dataset]
test = genfromtxt(open('filepath','r'), delimiter=' ', dtype='f8')
rf = RandomForestClassifier(n_estimators=100)
rf.fit(train, target)
predicted_probs = [[index + 1, x[1]] for index, x in enumerate(rf.predict_proba(test))]
savetxt('filepath', predicted_probs, delimiter=',', fmt='%d,%f',
header='Id,PredictedProbability', comments = '')
if __name__=="__main__":
main()
हालांकि मुझे निष्पादन पर निम्न त्रुटि मिलती है;
----> dataset = genfromtxt(open('C:/Users/Saurabh/Desktop/pgm/Cora/a_train.csv','r'), delimiter='', dtype='f8')
ValueError: Some errors were detected !
Line #88 (got 1435 columns instead of 1434)
Line #93 (got 1435 columns instead of 1434)
Line #164 (got 1435 columns instead of 1434)
Line #169 (got 1435 columns instead of 1434)
Line #524 (got 1435 columns instead of 1434)
...
...
...
कोई सुझाव है कि इससे कैसे बचें ?? धन्यवाद।
क्या हम इसे प्राप्त कर सकते हैं यदि कॉलम की संख्या बराबर नहीं है? –