मैं वर्तमान में मेरे डेटा को वर्गीकृत करने के LIBSVM समर्थन वेक्टर मशीन के MATLAB संस्करण का उपयोग करें। LIBSVM प्रलेखन का उल्लेख है कि एसवीएम लागू करने से पहले स्केलिंग बहुत महत्वपूर्ण है और हमें प्रशिक्षण और परीक्षण डेटा दोनों को स्केल करने के लिए एक ही विधि का उपयोग करना होगा।LIBSVM के लिए परीक्षण डेटा स्केलिंग: MATLAB कार्यान्वयन
"स्केलिंग की एक ही विधि" को समझाया गया है: उदाहरण के लिए, मान लें कि हमने [-10, +10]
से [-1, +1]
से प्रशिक्षण डेटा की पहली विशेषता को स्केल किया है।
(data - repmat(min(data,[],1),size(data,1),1))*spdiags(1./(max(data,[],1)-min(data,[],1))',0,size(data,2),size(data,2))
: परीक्षण डेटा की पहली विशेषता रेंज [-11, +8]
में निहित है, तो हम [0,1]
की रेंज में प्रशिक्षण डेटा स्केलिंग निम्नलिखित MATLAB कोड का उपयोग किया जा सकता है [-1.1, +0.8]
करने के लिए परीक्षण डेटा पैमाने चाहिए लेकिन मुझे नहीं पता कि परीक्षण डेटा को सही तरीके से कैसे स्केल करें।
आपकी मदद के लिए बहुत बहुत धन्यवाद।
मेरे सवाल यह है कि अगर है [ए, बी] श्रेणी [0,1] की श्रेणी में सामान्य डेटा, [सी, डी] की सीमा में परीक्षण डेटा किस सीमा तक सामान्यीकृत है? – Lily