मेरे पास "0" वर्ग (लगभग 30000 बनाम 1500) की ओर एक बड़ी स्कू के साथ एक बाइनरी क्लास डेटासेट (0/1) है। प्रत्येक उदाहरण के लिए 7 विशेषताएं हैं, कोई गुम मूल्य नहीं है।जानबूझकर वेका पेड़ वर्गीकृतों को कैसे खत्म करें?
जब मैं जे 48 या किसी अन्य पेड़ वर्गीकृत का उपयोग करता हूं, तो मुझे लगभग "1" उदाहरणों को "0" के रूप में गलत वर्गीकृत किया जाता है।
वर्गीकृत को "अप्रतिबंधित" पर सेट करना, प्रति पत्ते की न्यूनतम संख्या को 1 तक सेट करना, आत्मविश्वास कारक को 1 सेट करना, उदाहरण आईडी संख्या के साथ एक डमी विशेषता जोड़ना - इससे सब कुछ मदद नहीं करता है।
मैं सिर्फ एक मॉडल नहीं बना सकता जो मेरे डेटा को ओवरफिट करता है!
मैंने लगभग सभी अन्य वर्गीकृत वीका प्रदान किए हैं, लेकिन इसी तरह के परिणाम मिल गए हैं।
आईबी 1 का उपयोग 100% सटीकता (ट्रेनों पर ट्रेनेट) प्राप्त करता है, इसलिए यह एक ही सुविधा मूल्यों और विभिन्न वर्गों के साथ कई उदाहरणों की समस्या नहीं है।
मैं एक पूरी तरह से अप्रसन्न पेड़ कैसे बना सकता हूं? या अन्यथा मेरे डेटा को खत्म करने के लिए वेका को मजबूर करते हैं?
धन्यवाद।
अद्यतन: ठीक है, यह बेतुका है। मैं केवल बारे में 3100 और 1200 के नकारात्मक सकारात्मक उदाहरण का उपयोग किया है, और इस पेड़ मुझे मिल गया है (unpruned!):
J48 unpruned tree
------------------
F <= 0.90747: 1 (201.0/54.0)
F > 0.90747: 0 (4153.0/1062.0)
कहने की जरूरत नहीं, IB1 अभी भी 100% सटीक देता है।
अपडेट 2: मुझे नहीं पता कि मुझे यह कैसे याद आया - अनियंत्रित सरलकार्ट काम करता है और ट्रेन पर 100% सटीकता ट्रेन देता है; Pruned SimpleCart J48 के रूप में पक्षपातपूर्ण नहीं है और इसका सभ्य झूठा सकारात्मक और नकारात्मक अनुपात है।
संभव संबंधित सवाल: http://stackoverflow.com/ प्रश्न/2519 997/अलग-वजन-झूठी-सकारात्मक-और-झूठी-नकारात्मक-इन-तंत्रिका-नेटवर्क – Amro