की व्याख्या कैसे करें मैं वर्तमान में मशीन सीखने की समस्या से जूझ रहा हूं जबकि मुझे बहुत असंतुलित डेटा सेट से निपटना है। यही है, छह वर्ग हैं ('1', '2' ... '6')। दुर्भाग्य से उदा। वर्ग '1' 150 उदाहरण/उदाहरणों के लिए, '2' 9 0 उदाहरणों के लिए और केवल '3' वर्ग के लिए 20. अन्य सभी वर्गों को "प्रशिक्षित" नहीं किया जा सकता है क्योंकि इन कक्षाओं के लिए कोई उपलब्ध उदाहरण नहीं हैं।WEKA का नमूना फ़िल्टर करें - परिणाम
अब तक, मुझे पता चला है कि WEKA (मशीन सीखने टूलकिट जिसका मैं उपयोग कर रहा हूं) इस पर्यवेक्षित "अनुकरण" फ़िल्टर प्रदान करता है। जब मैं इस फ़िल्टर को 'नो रिप्लेसमेंट' = झूठी और 'bialToUniformClass' = 1.0 के साथ लागू करता हूं तो यह परिणाम डेटा सेट में होता है, जहां उदाहरणों की संख्या अच्छी होती है और लगभग बराबर होती है (कक्षा '1' के लिए .. '3' और अन्य खाली रहो)।
मेरा प्रश्न अब है: WEKA और यह फ़िल्टर विभिन्न वर्गों के लिए "नया"/अतिरिक्त उदाहरण कैसे उत्पन्न करता है।
किसी भी संकेत या सुझाव के लिए आपको बहुत पहले धन्यवाद।
चीयर्स जूलियन