मेरे पास कुछ मशीन सीखने के परिणाम हैं जो मुझे समझ में नहीं आता है। मैं पाइथन विज्ञान-सीखने का उपयोग कर रहा हूं, जिसमें लगभग 14 फीचर्स के 2+ मिलियन डेटा हैं। 'Ab' का वर्गीकरण सटीक-याद वक्र पर बहुत बुरा लगता है, लेकिन एबी के लिए आरओसी उतना ही अच्छा लगता है जितना कि अधिकांश अन्य समूहों के वर्गीकरण के रूप में। क्या समझा सकता है?अच्छा आरओसी वक्र लेकिन खराब परिशुद्धता-याद वक्र
उत्तर
कक्षा असंतुलन।
आरओसी वक्र के विपरीत, पीआर घटता असंतुलन के प्रति बहुत संवेदनशील हैं। यदि आप असंतुलित डेटा पर अच्छे एयूसी के लिए अपने वर्गीकृत को अनुकूलित करते हैं तो आपको खराब परिशुद्धता-याद परिणामों को प्राप्त करने की संभावना है।
मैं देखता हूं, लेकिन परीक्षण के प्रदर्शन के संदर्भ में इसका वास्तव में क्या अर्थ है? क्या यह अच्छा है (आरओसी पर आधारित) या बुरा (पी-आर के आधार पर)? उपर्युक्त पी-आर वक्र में यदि परीक्षण सबसे अच्छा हो सकता है तो परीक्षण कैसे अच्छा हो सकता है, दोनों परिशुद्धता और याद के लिए 40% है? – KubiK888
इसका मतलब है कि जब आप असंतुलित डेटा पर परीक्षण के प्रदर्शन की रिपोर्ट करते हैं तो आपको सावधान रहना होगा। चिकित्सा अनुप्रयोगों में इसका एक भयानक प्रभाव हो सकता है (टेक्स्टबुक केस के रूप में एड्स परीक्षण देखें), दूसरों में यह ठीक हो सकता है, यह वास्तव में आपके विशिष्ट एप्लिकेशन पर निर्भर करता है। – Calimo
मैंने डिफ़ॉल्ट सेटिंग को ट्विक नहीं किया क्योंकि मैं विज्ञान सीखने का उपयोग कर रहा हूं, लेकिन जैसा कि आपने कहा है कि यह एयूसी के आधार पर अनुकूलित करने लगता है, क्या असंतुलित डेटा में प्रेसिजन/रिकॉल जोड़ी के आधार पर अनुकूलित करने का कोई तरीका है? – KubiK888
- 1. आरओसी वक्र
- 2. यादृच्छिकता से वर्गीकरण के लिए आरओसी वक्र
- 3. कैरेट में प्रशिक्षण डेटा से आरओसी वक्र
- 4. आर लॉजिस्टिक रिग्रेशन एरिया वक्र
- 5. इक्विडिस्टेंट वक्र
- 6. मैं CGPath वक्र या क्वाड वक्र
- 7. घनत्व वक्र
- 8. हिल्बर्ट वक्र
- 9. बेजियर वक्र
- 10. सरल बहुआयामी वक्र ढाले
- 11. क्वैडिक वक्र को क्यूबिक वक्र में कनवर्ट करें
- 12. साइन वक्र आर
- 13. छवि विश्लेषण वक्र ढाले
- 14. जावा वक्र फिटिंग लाइब्रेरी
- 15. बेजियर वक्र और कैनवास
- 16. घन/वक्र चिकना अंतर्वेशन
- 17. वक्र पुनर्निर्माण कार्यान्वयन
- 18. जेड-ऑर्डर-वक्र समन्वय
- 19. ड्रा एसवीजी बेजियर वक्र
- 20. पायथन numpy/scipy वक्र फिटिंग
- 21. SciPy वैश्विक न्यूनतम वक्र फिट
- 22. वक्र में अंक की पहचान
- 23. उद्देश्य सी बेजियर वक्र रीशेपिंग
- 24. आर में फिटिंग लघुगणक वक्र
- 25. कैनवास: एनिमेट बेजियर वक्र ड्राइंग
- 26. एन-वें ऑर्डर बेजियर वक्र?
- 27. वक्र आर में फिटिंग NLS
- 28. Google लाइन चार्ट सामग्री वक्र
- 29. एक आदर्श वक्र तीन अंक
- 30. Magento सीखने की वक्र और सर्वोत्तम युक्तियाँ
क्या आपका सेट संतुलित है? (यानी गैर-एबी के रूप में कई एबी) – Calimo
नहीं, यह बहुत असंतुलित है, अब 2% से कम – KubiK888
से कम है। इस मुद्दे को कम करने के लिए oversampling का प्रयास करें। – Calimo