मेरे पास कक्षा असंतुलन समस्या है और विज्ञान-सीख (> = 0.16) में कार्यान्वयन का उपयोग करके भारित रैंडम वन के साथ प्रयोग कर रहा है।scikit-learn: यादृच्छिक वन class_weight और sample_weight पैरामीटर
मैंने देखा कार्यान्वयन पेड़ निर्माता में एक class_weight पैरामीटर और फिट विधि में sample_weight पैरामीटर लेता है उस वर्ग असंतुलन को हल करने की है। अंतिम वजन तय करने के लिए उन दोनों को गुणा किया जाना प्रतीत होता है।
मैं मुसीबत समझ है निम्नलिखित:
- क्या पेड़ निर्माण/प्रशिक्षण/भविष्यवाणी के चरणों उन वजन इस्तेमाल किया जाता है? मैंने भारित पेड़ों के लिए कुछ कागजात देखे हैं, लेकिन मुझे यकीन नहीं है कि विज्ञान क्या लागू करता है।
- क्लास_वेट और नमूना_वेट के बीच क्या अंतर है?
आप मूल वर्गीकरण के रूप में डीटी के बारे में सही हैं। मुझे यह भी रूचि है कि प्रशिक्षण के दौरान उन वजन का उपयोग कैसे किया जाता है (उदाहरण के लिए निर्णय नोड इत्यादि की अशुद्धता का निर्णय लेना) और भविष्यवाणी के दौरान। – user36047
'फिट()' विधि: [निर्णय पेड़ एपीआई] (http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn के तहत 'sample_weight' के लिए प्रलेखन देखें। पेड़। DecisionTreeClassifier) – Andreus
हालांकि यह क्रिस्टल स्पष्ट नहीं है, मुझे लगता है कि जब मैं लिंक में सामग्री को पचता हूं तो सबकुछ स्पष्ट होगा :) – user36047