का अर्थ मैं मशीन सीखने में अभी शुरुआत कर रहा हूँ और निर्णय वृक्ष के साथ प्रयोग कर रहा हूँ। मैं निर्णय पेड़ http://scikit-learn.org/dev/_images/iris.svg के इस विज़ुअलाइज़ेशन को देख रहा हूं और सोच रहा हूं कि त्रुटि मान क्या दर्शाता है। क्या यह गिनी इंडेक्स है या सूचना लाभ या क्या? यह भी सराहना करता है कि इसका क्या अर्थ है।Scikit Decistion ट्री दृश्य: त्रुटि मान
उत्तर
इस ठोस उदाहरण में, एक नोड के "त्रुटि" सारे उदाहरण उस नोड में पहुँच की गिनी सूचकांक है।
सामान्य तौर पर, एक नोड के "त्रुटि" ठोस अशुद्धता कसौटी (जैसे गिनी या वर्गीकरण के लिए एन्ट्रापी और दुर्गति के लिए वर्ग त्रुटि मतलब) पर निर्भर करता है।
Intuitively तुम दोनों अशुद्धता मापदंड (गिनी और एन्ट्रापी) एक उपाय कैसे सजातीय एक बहु सेट है के रूप में के बारे में सोच सकते हैं। एक बहु सेट एकरूप है यदि इसमें ज्यादातर प्रकार के तत्व होते हैं (इसे "शुद्ध" भी कहा जाता है, इस प्रकार नाम "अशुद्धता मानदंड")। हमारे मामले में बहु सेट के तत्व कक्षा लेबल हैं जो संबंधित नोड तक पहुंचते हैं। जब हम एक नोड को विभाजित करते हैं, हम चाहते हैं कि परिणामस्वरूप विभाजन शुद्ध हैं - जिसका अर्थ है कि कक्षाएं अच्छी तरह से अलग होती हैं (एक विभाजन में ज्यादातर वर्ग होते हैं)।
criterion="entropy"
के मामले में और बाइनरी वर्गीकरण 1.0 की एक त्रुटि का अर्थ है कि नोड (सबसे अधिक सजातीय बहु सेट) में समान संख्या में सकारात्मक और नकारात्मक उदाहरण हैं।
आप पेड़ डेटा संरचना है कि एक DecisionTreeClassifier
या DecisionTreeRegressor
underlies अपने tree_
विशेषता है जो एक्सटेंशन प्रकार sklearn.tree._tree.Tree
की वस्तु पर एक रखती है के माध्यम से पहुँच सकते हैं। यह वस्तु पेड़ को समांतर numpy arrays की एक श्रृंखला के रूप में दर्शाती है। सरणी init_error
प्रत्येक नोड की प्रारंभिक त्रुटि को पकड़ें; best_error
नोड एक विभाजन नोड है, तो दो विभाजन की त्रुटियों का योग रखता है। अधिक जानकारी के लिए https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/tree/_tree.pyx#L45 में कक्षा प्रलेखन देखें।
- 1. इनपुट प्रारूप scikit सीखने
- 2. विरल कार्यान्वयन/scikit सीखने
- 3. डाटाबेस बी-ट्री/बी + ट्री
- 4. का उपयोग scikit सीखने DecisionTreeClassifier
- 5. व्यू मॉडल में चयनित दृश्य में ट्री व्यू सिंक
- 6. त्रुटि प्रतीक नेविगेटर दृश्य
- 7. कोई दृश्य इंटरफ़ेस त्रुटि
- 8. बाध्यकारी त्रुटि मान उपयोगकर्ता inputted
- 9. संख्यात्मक मान के साथ आईडी 3 निर्णय ट्री
- 10. लिफ्ट त्रुटि मान
- 11. ट्री संरचना और Recursion
- 12. केकपीएचपी ट्री
- 13. अभिव्यक्ति ट्री
- 14. ट्री व्यू
- 15. बाइनरी ट्री
- 16. बाइनरी इंडेक्स ट्री (बीआईटी)
- 17. बाइंडिंग एलिमेंटनाम। क्या यह विजुअल ट्री या लॉजिकल ट्री
- 18. OpenCV दृश्य स्टूडियो लिंक त्रुटि
- 19. एलीमेंट ट्री तत्व
- 20. कार्यान्वयन बाइनरी ट्री रूबी
- 21. एनएस (ऐरे | ट्री) एकाधिक NSViewControllers
- 22. क्लिकऑन त्रुटि: मान अपेक्षित सीमा
- 23. MySQL गलत स्ट्रिंग मान त्रुटि
- 24. बाइनरी सर्च ट्री डिस्ट्रक्टर
- 25. SciPy NumPy और SciKit-learn, एक स्पैर मैट्रिक्स
- 26. केडी-ट्री GLSL
- 27. ट्री व्यू में एकाधिक चयन
- 28. आईडीए - सकारात्मक स्पा मान त्रुटि मिली है
- 29. एलिमेंट ट्री उदाहरण
- 30. ट्री व्यू/ट्री व्यूइटम नियंत्रण टेम्पलेट्स बिंदीदार लाइनों के साथ
सहज अर्थ सरल है: यह सच वर्गीकरण त्रुटि के लिए एक प्रॉक्सी है कि अगर आपको लगता है कि नोड के लिए पेड़ पर पार, फिर भविष्यवाणी है कि यह सलाह देते हैं बनाने (जाहिरा तौर पर चित्र में नहीं दिखाया गया है ...)। –