2014-10-11 24 views
12

एक आर उपयोगकर्ता के रूप में, मैं भी विज्ञान पर गति प्राप्त करना चाहता था।विज्ञान-किट और रिग्रेशन सारांश

रैखिक, रिज और लासो के साथ शुरू हुआ। मैं उदाहरणों के माध्यम से चला गया है। नीचे मूल ओएलएस के लिए है।

मॉडल सेट अप करने के लिए पर्याप्त उचित लगता है- लेकिन रिग्रेशन आउटपुट का मानक सेट प्राप्त करने का उचित तरीका नहीं दिख रहा है। मेरी कोड में

उदाहरण:

# Linear Regression 
import numpy as np 
from sklearn import datasets 
from sklearn.linear_model import LinearRegression 
# load the diabetes datasets 
dataset = datasets.load_diabetes() 
# fit a linear regression model to the data 
model = LinearRegression() 
model.fit(dataset.data, dataset.target) 
print(model) 
# make predictions 
expected = dataset.target 
predicted = model.predict(dataset.data) 
# summarize the fit of the model 
mse = np.mean((predicted-expected)**2) 
print model.intercept_, model.coef_, mse, 
print(model.score(dataset.data, dataset.target)) 

तरह अवरोधन और coef मॉडल में बनाया गया है लगता है, और मैं सिर्फ उन्हें देखने के लिए प्रिंट (अंतिम पंक्ति से पीछे नहीं) टाइप करें। R^2, समायोजित आर^2, पी मान, इत्यादि जैसे अन्य सभी मानक रिग्रेशन आउटपुट के बारे में क्या। यदि मैं सही ढंग से उदाहरण पढ़ता हूं, ऐसा लगता है कि आपको इनमें से प्रत्येक के लिए फ़ंक्शन/समीकरण लिखना है और फिर इसे प्रिंट करना है।

तो, क्या लिन रेग मॉडल के लिए कोई मानक सारांश आउटपुट नहीं है?

इसके अलावा, गुणांक के आउटपुट के मेरे मुद्रित सरणी में, इनमें से प्रत्येक के साथ कोई परिवर्तनीय नाम नहीं है? मुझे बस संख्यात्मक सरणी मिलती है। क्या इन्हें मुद्रित करने का कोई तरीका है जहां मुझे गुणांक का आउटपुट मिलता है और वे चर के साथ जाते हैं?

मेरे मुद्रित आउटपुट

LinearRegression(copy_X=True, fit_intercept=True, normalize=False) 
152.133484163 [ -10.01219782 -239.81908937 519.83978679 324.39042769 -792.18416163 
    476.74583782 101.04457032 177.06417623 751.9 67.62538639] 2859.69039877 
0.517749425413 

scilearn उपयोगकर्ताओं के लिए धन्यवाद।

+0

कई मानक मूल्यांकन मीट्रिक ['sklearn.metrics'] (http://scikit-learn.org/stable/modules/classes.html#sklearn-metrics-metrics) में उपलब्ध हैं। –

उत्तर

21

sklearn में कोई आर प्रकार प्रतिगमन सारांश रिपोर्ट मौजूद नहीं है। मुख्य कारण यह है कि स्केलेर्न का पूर्वानुमान पूर्वानुमानित मॉडलिंग/मशीन लर्निंग के लिए किया जाता है और मूल्यांकन मानदंड पहले अदृश्य डेटा (जैसे कि प्रतिगमन के लिए अनुमानित आर^2) पर प्रदर्शन पर आधारित होते हैं।

sklearn.metrics.classification_report नामक वर्गीकरण के लिए सारांश कार्य मौजूद है जो वर्गीकरण मॉडल पर कई प्रकार के (अनुमानित) स्कोर की गणना करता है।

अधिक क्लासिक सांख्यिकीय दृष्टिकोण के लिए, statsmodels पर एक नज़र डालें।

संबंधित मुद्दे