मैं आर में वर्गीकरण के लिए यादृच्छिक जंगलों पैकेज का उपयोग करने के लिए कोशिश कर रहा हूँआर रैंडम वन चर महत्व
चर महत्व सूचीबद्ध उपाय कर रहे हैं:
- वर्ग 0 के लिए चर x के कच्चे महत्व स्कोर मतलब वर्ग 1
MeanDecreaseAccuracy
MeanDecreaseGini
के लिए चर x का
- मतलब कच्चे महत्व स्कोर
अब मुझे पता है कि इन "मतलब" के रूप में मैं उनकी परिभाषाओं को जानता हूं। मैं क्या जानना चाहता हूं कि उनका उपयोग कैसे करें।
क्या मैं सच में जानना चाहता हूँ कि क्या इन मूल्यों आदि कितने सही वे कर रहे हैं की केवल संदर्भ, क्या एक अच्छा मूल्य है, क्या एक बुरा मान है, क्या अधिकतम और न्यूनतम कर रहे हैं,
में मतलब है यदि एक चर के उच्च MeanDecreaseAccuracy
या MeanDecreaseGini
है तो इसका मतलब यह महत्वपूर्ण या महत्वहीन है? कच्चे स्कोर पर भी कोई जानकारी भी उपयोगी हो सकती है। मैं उन सभी संख्याओं के बारे में जानना चाहता हूं जो उनके आवेदन के लिए प्रासंगिक हैं।
एक स्पष्टीकरण जो 'त्रुटि', 'संक्षेप', या 'क्रमबद्ध' शब्दों का उपयोग करता है, एक सरल स्पष्टीकरण होगा जिसमें यादृच्छिक वन कैसे काम करता है इस बारे में कोई चर्चा शामिल नहीं है।
जैसा कि मैं चाहता था कि कोई मुझे रेडियो का उपयोग करने के बारे में समझाए, तो मुझे यह समझने की उम्मीद नहीं होगी कि एक रेडियो रेडियो तरंगों को कैसे ध्वनि में परिवर्तित करता है।
कृपया, गिनी परिभाषा का लिंक शामिल करें जो वास्तव में नोड विभाजन के लिए उपयोग किया जाता है: http://en.wikipedia.org/wiki/Decision_tree_learning#Gini_impurity – tashuhka