2016-03-10 11 views
5

क्या बड़े असंतुलित डेटा सेट में मॉडल फिट करने के लिए ट्रेन फ़ंक्शन का उपयोग करते समय स्तरीकृत क्रॉस सत्यापन करने का कोई तरीका है? मुझे पता है कि सीधे आगे के गुना क्रॉस सत्यापन संभव है लेकिन मेरी श्रेणियां अत्यधिक असंतुलित हैं। मैंने इस विषय के बारे में चर्चा देखी है लेकिन कोई वास्तविक निश्चित उत्तर नहीं है।कैरेट पैकेज: ट्रेन फ़ंक्शन में स्ट्रैटिफाइड क्रॉस सत्यापन

अग्रिम धन्यवाद।

+0

मैं भी उत्तर की तलाश में हूं ... डिफ़ॉल्ट रूप से, फ़ंक्शन createFolds() स्तरीकृत फ़ोल्ड बनाता है। लेकिन ट्रेन नियंत्रण में विधि = "सीवी" का उपयोग करते समय मुझे ट्रेन फ़ंक्शन के बारे में निश्चित नहीं है। – jbrettas

उत्तर

7

'इंडेक्स' नामक एक पैरामीटर है जो उपयोगकर्ता को इंडेक्स को क्रॉस सत्यापन करने के लिए निर्दिष्ट कर सकता है।

folds <- 4 
cvIndex <- createFolds(factor(training$Y), folds, returnTrain = T) 
tc <- trainControl(index = cvIndex, 
       method = 'cv', 
       number = folds) 

rfFit <- train(Y ~ ., data = training, 
      method = "rf", 
      trControl = tc, 
      maximize = TRUE, 
      verbose = FALSE, ntree = 1000) 
संबंधित मुद्दे