2014-04-10 8 views
11

मैंने बहुत बड़े डेटासेट के साथ पाइथन स्कीट सीखें मॉड्यूल से एक RandomForestClassifier को प्रशिक्षित किया है, लेकिन सवाल यह है कि मैं संभवतः इस मॉडल को कैसे सहेज सकता हूं और अन्य लोगों को इसे अपने अंत में लागू करने देता हूं। धन्यवाद!पायथन से RandomForest क्लासिफायर आउटपुट कैसे आउटपुट?

+0

http://scikit-learn.org/stable/tutorial/basic/tutorial.html#model-persistence देखें – EdChum

उत्तर

23

सिफारिश की विधि joblib, इस का उपयोग करने के लिए है परिणामस्वरूप एक अचार की तुलना में बहुत छोटी फ़ाइल होगी:

from sklearn.externals import joblib 
joblib.dump(clf, 'filename.pkl') 

#then your colleagues can load it 

clf = joblib.load('filename.pk1') 

online docs

4

क्या आपने पिकल मॉड्यूल का उपयोग करके RandomForestClassifier को चुनने और फिर डिस्क पर सहेजने का प्रयास किया है?

import pickle 

classifier = RandomForestClassifier(etc) 
output = open('classifier.pkl', 'wb') 
pickle.dump(classifier, output) 
output.close() 

"अन्य लोगों को" तो मसालेदार वस्तु को फिर से लोड कर सकता है इस प्रकार है::

यहाँ एक उदाहरण pickle डॉक्स पर आधारित है

import pickle 

f = open('classifier.pkl', 'rb') 
classifier = pickle.load(f) 
f.close() 
+1

joblib को प्राथमिकता दी और कम शब्दाडंबरपूर्ण है देखें (अर्थात छोटी फ़ाइल): http://scikit-learn.org/stable/tutorial/basic/tutorial.html#model-persवाद – EdChum

संबंधित मुद्दे