2012-03-12 11 views

उत्तर

47

मान लें कि मॉडल फिट करने के लिए उपयोग किए गए नमूने पर कंप्यूटिंग त्रुटि दर का मतलब है, आप printcp() का उपयोग कर सकते हैं। उदाहरण के लिए, ऑन लाइन उदाहरण का उपयोग,

> library(rpart) 
> fit <- rpart(Kyphosis ~ Age + Number + Start, data=kyphosis) 
> printcp(fit) 

Classification tree: 
rpart(formula = Kyphosis ~ Age + Number + Start, data = kyphosis) 

Variables actually used in tree construction: 
[1] Age Start 

Root node error: 17/81 = 0.20988 

n= 81 

     CP nsplit rel error xerror xstd 
1 0.176471  0 1.00000 1.00000 0.21559 
2 0.019608  1 0.82353 0.82353 0.20018 
3 0.010000  4 0.76471 0.82353 0.20018 

Root node error भविष्य कहनेवाला प्रदर्शन के दो उपायों की गणना करने के लिए, जब rel error और xerror स्तंभ में प्रदर्शित मूल्यों पर विचार, और जटिलता पैरामीटर के आधार पर (प्रथम कॉलम) प्रयोग किया जाता है :

  • 0,76471 एक्स ०.२०९८८ = 0.१६,०४,९७३ (16.0%) resubstitution त्रुटि दर है (यानी, प्रशिक्षण नमूने पर गणना की त्रुटि दर) - यह मोटे तौर पर

    012,351,641 है
    class.pred <- table(predict(fit, type="class"), kyphosis$Kyphosis) 
    1-sum(diag(class.pred))/sum(class.pred) 
    
  • 0,82353 एक्स ०.२०९८८ = 0.१७,२८,४२५ (17.2%) पार मान्य त्रुटि दर (10 गुना सीवी उपयोग कर रहा है, rpart.control() में xval देखते हैं; लेकिन xpred.rpart() और plotcp() देखें जो इस तरह के उपाय पर निर्भर करता है)। यह उपाय अनुमानित सटीकता का एक और अधिक उद्देश्य सूचक है।

ध्यान दें कि यह tree से अधिक या वर्गीकरण सटीकता के साथ समझौते में कम है:

> library(tree) 
> summary(tree(Kyphosis ~ Age + Number + Start, data=kyphosis)) 

Classification tree: 
tree(formula = Kyphosis ~ Age + Number + Start, data = kyphosis) 
Number of terminal nodes: 10 
Residual mean deviance: 0.5809 = 41.24/71 
Misclassification error rate: 0.1235 = 10/81 

जहां Misclassification error rate प्रशिक्षण नमूना से की जाती है।

संबंधित मुद्दे