2012-06-29 11 views
9

से बाहर की भविष्यवाणियों को एकत्रित करना मैं एक दूसरे चरण मॉडल को प्रशिक्षित करने के लिए एक कैरेट मॉडल से बाहर की भविष्यवाणियों का उपयोग करना चाहता हूं जिसमें कुछ मूल भविष्यवाणियों को शामिल किया गया है। इस प्रकार मैं बाहर के गुना भविष्यवाणियों को इकट्ठा कर सकते हैं:एक कैरेट मॉडल

#Load Data 
set.seed(1) 
library(caret) 
library(mlbench) 
data(BostonHousing) 

#Build Model (see ?train) 
rpartFit <- train(medv ~ . + rm:lstat, data = BostonHousing, method="rpart", 
       trControl=trainControl(method='cv', number=folds, 
             savePredictions=TRUE)) 

#Collect out-of-fold predictions 
out_of_fold <- rpartFit$pred 
bestCP <- rpartFit$bestTune[,'.cp'] 
out_of_fold <- out_of_fold[out_of_fold$.cp==bestCP,] 

कौन महान है, लेकिन वे गलत क्रम में हैं:

> all.equal(out_of_fold$obs, BostonHousing$medv) 
[1] "Mean relative difference: 0.4521906" 

मैं जानता हूँ कि train वस्तु जो अनुक्रमित की सूची लौटाता है

> str(rpartFit$control$index) 
List of 10 
$ Fold01: int [1:457] 1 2 3 4 5 6 7 8 9 10 ... 
$ Fold02: int [1:454] 2 3 4 8 10 11 12 13 14 15 ... 
$ Fold03: int [1:457] 1 2 3 4 5 6 7 8 9 10 ... 
$ Fold04: int [1:455] 1 2 3 5 6 7 8 9 10 11 ... 
$ Fold05: int [1:455] 1 2 3 4 5 6 7 8 9 10 ... 
$ Fold06: int [1:455] 1 2 3 4 5 6 7 8 9 10 ... 
$ Fold07: int [1:457] 1 3 4 5 6 7 8 9 10 13 ... 
$ Fold08: int [1:455] 1 2 4 5 6 7 9 11 12 14 ... 
$ Fold09: int [1:455] 1 2 3 4 5 6 7 8 9 10 ... 
$ Fold10: int [1:454] 1 2 3 4 5 6 7 8 9 10 ... 

मैं इस जानकारी का उपयोग कैसे कर सकते हैं के रूप में मूल +०१२३४४८२९७ उसी क्रम में मेरी out_of_fold वस्तु में टिप्पणियों डाल करने के लिए: प्रत्येक गुना प्रशिक्षित करने के लिए इस्तेमाल किया गयाडेटासेट?

उत्तर

6

मैं आउटपुट में एक और कॉलम जोड़ूंगा जो अगली रिलीज (शायद अब से एक महीने) में प्रत्येक नमूने के लिए मूल पंक्ति संख्या इंगित करता है।

अधिकतम

+0

बहुत बढ़िया, बहुत बहुत धन्यवाद! – Zach

संबंधित मुद्दे