प्रदर्शन करते समय अवलोकन की न्यूनतम संख्या क्या बहुत कम डेटासेट में RandomForests को लागू करना संभव है? मेरे पास कई चर के साथ एक डेटासेट है लेकिन प्रत्येक केवल 25 अवलोकन है। यादृच्छिक वन कम ओओबी त्रुटियों (10-25%) के साथ उचित परिणाम उत्पन्न करते हैं। क्या उपयोग करने के लिए न्यूनतम संख्या में अवलोकन के बारे में अंगूठे का कोई नियम है? वास्तव में प्रतिक्रिया चर में से एक असंतुलित है, और यदि मैं इसे कम करने जा रहा हूं तो मैं अवलोकनों की एक छोटी संख्या के साथ समाप्त हो जाऊंगा। अग्रिम धन्यवादरैंडम वन
Q
रैंडम वन
5
A
उत्तर
3
इस प्रकार के डेटासेट (यानी पी> एन) पर बिल्कुल आरएफ का उपयोग किया जा सकता है। वास्तव में वे जीनोमिक्स जैसे क्षेत्रों में आरएफ का उपयोग करते हैं जहां फ़ील्ड की संख्या> = 20000 और केवल पंक्तियों की एक बहुत छोटी संख्या है - 10-12 कहें। पूरी समस्या यह पता लग रही है कि 20k चर किस प्रकार एक पारदर्शी मार्कर बनाते हैं (यानी फीचर चयन पूरी समस्या है)।
मेरे पास न्यूनतम आकार के बारे में कोई भी आरओटी नहीं है, यदि आपका मॉडल किसी पिछड़े नमूने पर अच्छा काम नहीं करता है (या होल्ड-वन-बैक क्रॉस सत्यापन आपके मामले में अच्छी तरह से काम कर सकता है) तो आपको कोशिश करनी चाहिए कुछ और।
आशा है कि यह
संबंधित मुद्दे
- 1. रैंडम वन hyperparameter ट्यूनिंग GridSearchCV
- 2. आर रैंडम वन चर महत्व
- 3. रैंडम वन क्लासिफायर सेगमेंटेशन फॉल्ट
- 4. विज्ञान-सीखने में संतुलित रैंडम वन (पायथन)
- 5. अमेलीया इंप्यूटेड डेटा से कई रैंडम वन मॉडल का मिश्रण
- 6. NHibernate वन-टू-वन
- 7. सिम्फनी वन-टू-वन रिलेशन
- 8. इकाई फ्रेमवर्क वन-टू-वन मैपिंग मुद्दे
- 9. रैंडम तत्व
- 10. `रैंडम` ऑब्जेक्ट
- 11. वन लाइन
- 12. इकाई फ्रेमवर्क कोड पहला वन-टू-वन आवश्यक-आवश्यक रिश्ते
- 13. जावा - रैंडम लाइन
- 14. ओपनसीवी - यादृच्छिक वन उदाहरण
- 15. क्रैपी रैंडम नंबर जेनरेटर
- 16. रैंडम स्तंभ कैसेंड्रा
- 17. मैगेंटो वन पेज चेकआउट
- 18. रैंडम भारित पसंद
- 19. एंड्रॉइड: एचटीसी वन एक्स
- 20. हास्केल रैंडम जनरेशन
- 21. रैंडम ऑब्जेक्ट सी #
- 22. स्पार्क एमएल यादृच्छिक वन
- 23. स्विफ्ट 2.0 रैंडम EXC_BAD_ACCESS
- 24. रैंडम भारित पसंद
- 25. एसक्यूएल सर्वर रैंडम सॉर्ट
- 26. निर्देशिकाएँ वन स्टेप अप
- 27. अजगर रैंडम स्लाइस मुहावरा
- 28. सीएसवी रैंडम एक्सेस; सी #
- 29. Mysql 1 रैंडम पंक्ति
- 30. रैंडम अमान्य प्रामाणिकता डीबगिंग
प्रशिक्षण सेट में कितनी सुविधाएं शामिल हैं? – jonnydedwards
इसमें 33 भविष्यवाणियों और 4 प्रतिक्रिया चर शामिल हैं (मुझे 4 आरएफ करना चाहिए) – Oritteropus
जांचें [यह] (http://stats.stackexchange.com/questions/10079/rules-of-thumb-for-minimum- नमूना- आकार- हेरिस्टिक्स के लिए बाहर-एकाधिक-प्रतिगमन)। – jonnydedwards