2013-11-24 7 views
5

मैं यह समझने की कोशिश कर रहा हूं कि विज्ञान-सीखने के पैकेज से कौन सा निर्णय पेड़ विधि वर्गीकरण कार्य करने के लिए मेरी आवश्यकताओं के अनुरूप बेहतर होगा।निर्णय ट्री क्लासिफायर बनाम ExtraTreeClassifier

हालांकि, मैंने पाया वहाँ दो निर्णय वृक्ष वहाँ उपलब्ध मॉडल हैं कि:

  • मानक DecisionTreeClassifier scikit.tree पैकेज से अनुकूलित कार्ट एल्गोरिथ्म पर आधारित है।
  • enskble विधि ExtraTreeClassifier scikit.ensemble पैकेज से।

क्या कोई भी इन मॉडलों में से प्रत्येक का उपयोग करने के फायदे और नुकसान निर्दिष्ट कर सकता है?

उत्तर

11

ExtraTreeClassifierDecisionTreeClassifier का एक बेहद यादृच्छिक संस्करण है जिसका अर्थ आंतरिक रूप से ExtraTreesClassifier ensemble के हिस्से के रूप में उपयोग किया जाना है। एक

Averaging ensembles जैसे RandomForestClassifier और ExtraTreesClassifier विचरण समस्याओं (मजबूती के अभाव प्रशिक्षण सेट में छोटे परिवर्तन के संबंध में) अलग-अलग DecisionTreeClassifier उदाहरणों में से निपटने के लिए होती हैं।

यदि आपका मुख्य लक्ष्य भविष्यवाणी सटीकता को अधिकतम कर रहा है तो आपको व्यक्तिगत निर्णय पेड़ों को प्रशिक्षित करने के बजाय लगभग ExtraTreesClassifier (या वैकल्पिक रूप से boosting ensemble) के निर्णय पेड़ों के एक समूह का उपयोग करना चाहिए।

अधिक जानकारी के लिए मूल Extra Trees paper पर एक नज़र डालें।

संबंधित मुद्दे