मैंने sklearn का उपयोग कर एक एसवीएम को प्रशिक्षित करने के लिए एक नमूना कार्यक्रम किया था। यहां कोडजॉबलिब का उपयोग कर स्केलेर्न डंपिंग मॉडल, कई फाइलों को डंप करता है। सही मॉडल कौन सा है?
from sklearn import svm
from sklearn import datasets
from sklearn.externals import joblib
clf = svm.SVC()
iris = datasets.load_iris()
X, y = iris.data, iris.target
clf.fit(X, y)
print(clf.predict(X))
joblib.dump(clf, 'clf.pkl')
जब मैं मॉडल फ़ाइल को डंप करता हूं तो मुझे यह फाइलें मिलती हैं। :
[ 'clf.pkl', 'clf.pkl_01.npy', 'clf.pkl_02.npy', 'clf.pkl_03.npy', 'clf.pkl_04.npy', 'clf.pkl_05। npy ',' clf.pkl_06.npy ',' clf.pkl_07.npy ',' clf.pkl_08.npy ',' clf.pkl_09.npy ',' clf.pkl_10.npy ',' clf.pkl_11.npy ' ]
अगर मैं कुछ गलत करता हूं तो मैं उलझन में हूं। या यह सामान्य है? * .npy फाइलें क्या है। और 11 क्यों हैं?
मुमकिन है उन अपने डेटा के लिए 'numpy' सरणियों, कर रहे हैं' joblib' जब वापस लोड हो रहा है '.pkl' उन' np' सरणियों के लिए देखो और मॉडल डेटा – EdChum
मैं सिर्फ एहसास हुआ वापस लोड होगा कि अगर मैं का उपयोग joblib.dump (clf, 'clf.pkl', compress = 9) मुझे केवल 1 clf.pkl फ़ाइल मिलती है। तो मुझे लगता है कि आपने कहा है कि वे numpy arrays हैं। लोडिंग के दौरान मैंने मैन्युअल रूप से लोड किया है या इसे स्वचालित रूप से लोड किया गया है? –
मुझे उम्मीद है कि वे स्वचालित रूप से लोड हो जाएंगे, बस इसे – EdChum