2016-04-21 9 views
5

का उपयोग कर बहुराष्ट्रीय लॉजिस्टिक रिग्रेशन का उपयोग कैसे करें मेरे पास नीचे एक टेस्ट डेटासेट और ट्रेन डेटासेट है। मैंने न्यूनतम रिकॉर्ड के साथ नमूना डेटा प्रदान किया है, लेकिन मेरे डेटा में 1000 से अधिक रिकॉर्ड हैं। यहां ई मेरा लक्ष्य चर है जिसे मुझे एल्गोरिदम का उपयोग करने की भविष्यवाणी करने की आवश्यकता है। इसमें केवल चार श्रेणियां हैं जैसे 1,2,3,4। यह केवल इन मानों में से कोई भी ले सकता है।पायथन: SKlearn

प्रशिक्षण डेटासेट:

A B C D E 
1 20 30 1 1 
2 22 12 33 2 
3 45 65 77 3 
12 43 55 65 4 
11 25 30 1 1 
22 23 19 31 2 
31 41 11 70 3 
1 48 23 60 4 

टेस्ट डेटासेट:

A B C D E 
11 21 12 11 
1 2 3 4 
5 6 7 8 
99 87 65 34 
11 21 24 12 

के बाद से ई केवल 4 श्रेणियों है, मैं इस का उपयोग कर Multinomial रसद प्रतिगमन (1 बनाम बाकी तर्क) की भविष्यवाणी के बारे में सोचा। मैं अजगर का उपयोग कर इसे लागू करने की कोशिश कर रहा हूं।

मैं तर्क है कि हम एक चर में इन लक्ष्यों को निर्धारित करने और इन मूल्यों के किसी भी भविष्यवाणी करने के लिए एक एल्गोरिथ्म उपयोग करने की आवश्यकता पता:

output = [1,2,3,4] 

लेकिन मैं कैसे अजगर का उपयोग कर इसे उपयोग करने के लिए पर एक बिंदु पर अटक कर रहा हूँ (sklearn) इन मानों के माध्यम से लूप करने के लिए और आउटपुट मूल्यों की भविष्यवाणी करने के लिए मुझे क्या एल्गोरिदम का उपयोग करना चाहिए? किसी भी मदद की बहुत सराहना की जाएगी

+1

इस ट्यूटोरियल एक अच्छी जगह http://scikit-learn.org/stable/auto_examples/exercises/digits_classification_exercise.html शुरू करने के लिए – maxymoo

उत्तर

5

LogisticRegression कई कक्षाओं के बाहर-द-बॉक्स को संभाल सकता है।

X = df[['A', 'B', 'C', 'D']] 
y = df['E'] 
lr = LogisticRegression() 
lr.fit(X, y) 
preds = lr.predict(X) # will output array with integer values. 
1

आप इस अनिवार्य रूप से कोशिश कर सकते

LogisticRegression(multi_class='multinomial',solver ='newton-cg').fit(X_train,y_train) 
+0

किया जाना चाहिए नहीं इस सवाल के मौजूदा उत्तर के समान ही? – ostergaard

संबंधित मुद्दे