एक आर उपयोगकर्ता के रूप में, मैं भी विज्ञान पर गति प्राप्त करना चाहता था।विज्ञान-किट और रिग्रेशन सारांश
रैखिक, रिज और लासो के साथ शुरू हुआ। मैं उदाहरणों के माध्यम से चला गया है। नीचे मूल ओएलएस के लिए है।
मॉडल सेट अप करने के लिए पर्याप्त उचित लगता है- लेकिन रिग्रेशन आउटपुट का मानक सेट प्राप्त करने का उचित तरीका नहीं दिख रहा है। मेरी कोड में
उदाहरण:
# Linear Regression
import numpy as np
from sklearn import datasets
from sklearn.linear_model import LinearRegression
# load the diabetes datasets
dataset = datasets.load_diabetes()
# fit a linear regression model to the data
model = LinearRegression()
model.fit(dataset.data, dataset.target)
print(model)
# make predictions
expected = dataset.target
predicted = model.predict(dataset.data)
# summarize the fit of the model
mse = np.mean((predicted-expected)**2)
print model.intercept_, model.coef_, mse,
print(model.score(dataset.data, dataset.target))
तरह अवरोधन और coef मॉडल में बनाया गया है लगता है, और मैं सिर्फ उन्हें देखने के लिए प्रिंट (अंतिम पंक्ति से पीछे नहीं) टाइप करें। R^2, समायोजित आर^2, पी मान, इत्यादि जैसे अन्य सभी मानक रिग्रेशन आउटपुट के बारे में क्या। यदि मैं सही ढंग से उदाहरण पढ़ता हूं, ऐसा लगता है कि आपको इनमें से प्रत्येक के लिए फ़ंक्शन/समीकरण लिखना है और फिर इसे प्रिंट करना है।
तो, क्या लिन रेग मॉडल के लिए कोई मानक सारांश आउटपुट नहीं है?
इसके अलावा, गुणांक के आउटपुट के मेरे मुद्रित सरणी में, इनमें से प्रत्येक के साथ कोई परिवर्तनीय नाम नहीं है? मुझे बस संख्यात्मक सरणी मिलती है। क्या इन्हें मुद्रित करने का कोई तरीका है जहां मुझे गुणांक का आउटपुट मिलता है और वे चर के साथ जाते हैं?
मेरे मुद्रित आउटपुट
LinearRegression(copy_X=True, fit_intercept=True, normalize=False)
152.133484163 [ -10.01219782 -239.81908937 519.83978679 324.39042769 -792.18416163
476.74583782 101.04457032 177.06417623 751.9 67.62538639] 2859.69039877
0.517749425413
scilearn उपयोगकर्ताओं के लिए धन्यवाद।
कई मानक मूल्यांकन मीट्रिक ['sklearn.metrics'] (http://scikit-learn.org/stable/modules/classes.html#sklearn-metrics-metrics) में उपलब्ध हैं। –