2012-03-25 11 views
12

में अवलोकन वजन शामिल करना अवलोकन वजन के साथ मैं RrandomForest पैकेज का उपयोग कैसे कर सकता हूं? मुझे पता है कि इस पैकेज में ऐसा कोई विकल्प नहीं है।randomForest पैकेज

  1. इस समस्या randomForest पैकेज का उपयोग करने के लिए किसी भी समाधान कर रहे हैं: मैं 2 प्रश्न हैं? इस समय मैं संभावना के रूप में वजन के साथ डेटा से नमूने ड्राइंग कर रहा हूँ तो मैं कम से कम यह अनुकरण कर सकते हैं:

    m = dim(data)[1] 
    sample(data, m, replace=TRUE, prob=weights) 
    

    यह काम करता है अन्य (बेहतर) समाधान देखते हैं?

  2. क्या randomForest पैकेज के कोई विकल्प हैं। मुझे party पैकेज (cforest) मिला लेकिन यह स्मृति प्रबंधन के मामले में भयानक है (या मैं इसे randomForest पैकेज का उपयोग करने के तरीके का उपयोग नहीं कर सकता)। मेरे पास लगभग 200k अवलोकन और 30-40 चर हैं।

संपादित करें: विवरण स्पष्ट नहीं करने के लिए

क्षमा करें। मैं randomForest पैकेज का उपयोग रिग्रेशन समस्या (वर्गीकरण नहीं) के लिए कर रहा हूं। यह एक समय श्रृंखला है और हर अवलोकन में इसका वजन होता है। बाद में इस वजन पर परीक्षण अवलोकनों में मॉडल प्रदर्शन निर्धारित करने के लिए उपयोग किया जाता है। वाई चर निरंतर है।

+0

http://stats.stackexchange.com –

उत्तर

1

randomForest एक "classwt" पैरामीटर है कि आप अंतर नमूना संभावनाओं के लिए या यहां तक ​​कि अंतर लागत के लिए खाते के लिए अनुमति चाहिए होता है। बेशक यह प्रतिगमन साथ नजरअंदाज कर दिया है शायद आप स्पष्टीकरण दें कि आप भार और y चर किस तरह प्रयोग कर रहे हैं उपयोग करने की आवश्यकता चाहिए।

1

मैं वही विकल्प ढूंढ रहा था जैसे आप रैंडम वन में Pawel। और मैं पैकेज "रेंजर" आर समारोह "रेंजर" में यह शामिल किया गया है में (पैरामीटर "case.weights" के माध्यम से) पता लगा।

जून 2016 में जारी किया गया पैकेज इसलिए यह बहुत छोटा है।

बेस्ट,

+0

मैं सिर्फ पता लगा randomForestSRC भी अपनी रिहाई 2.2.0 में एक case.wt पैरामीटर शामिल पर अधिक ब्याज मिल सकती है। देखें 'rfsrc.news()' randomForestSRC का नवीनतम संस्करण के साथ स्थापित किया! यह समाधान सुरक्षित हो सकता है के बाद से randomForestSRC एक व्यापक रूप से इस्तेमाल पैकेज है! बेस्ट, – Ooona

संबंधित मुद्दे