2012-09-11 19 views
6

मैं वर्गीकरण कार्य के लिए आर प्लेटफ़ॉर्म में randomForest पैकेज का उपयोग कर रहा हूं।यादृच्छिकता से वर्गीकरण के लिए आरओसी वक्र

rf_object<-randomForest(data_matrix, label_factor, cutoff=c(k,1-k)) 

जहां के 0.1 से 0.9 तक है।

pred <- predict(rf_object,test_data_matrix) 

मेरे पास यादृच्छिक वन वर्गीकरण से आउटपुट है और मैंने इसे लेबल के साथ तुलना की है। इसलिए, मेरे पास 9 कटऑफ पॉइंट्स के लिए सटीकता, एमसीसी, संवेदनशीलता, विशिष्टता इत्यादि जैसे प्रदर्शन उपायों हैं।

अब, मैं आरओसी वक्र को साजिश करना चाहता हूं और आरओसी वक्र के तहत क्षेत्र प्राप्त करना चाहता हूं ताकि यह देखने के लिए कि प्रदर्शन कितना अच्छा है। आर (जैसे आरओसीआर, पीआरओसी) में अधिकांश पैकेज भविष्यवाणी और लेबल की आवश्यकता होती है लेकिन मेरे पास संवेदनशीलता (टीपीआर) और विशिष्टता (1-एफपीआर) है।

क्या कोई मुझे सुझाव दे सकता है कि कटऑफ विधि आरओसी वक्र का उत्पादन करने के लिए सही या विश्वसनीय है या नहीं? क्या आप टीपीआर और एफपीआर का उपयोग कर वक्र के तहत आरओसी वक्र और क्षेत्र प्राप्त करने के किसी भी तरीके से जानते हैं?

मैंने यादृच्छिक जंगल को प्रशिक्षित करने के लिए निम्न आदेश का उपयोग करने का भी प्रयास किया। इस तरह भविष्यवाणियां निरंतर थीं और आर में ROCR और pROC पैकेजों के लिए स्वीकार्य थीं, लेकिन मुझे यकीन नहीं है कि यह करने का सही तरीका है या नहीं। क्या कोई मुझे इस विधि के बारे में सुझाव दे सकता है?

rf_object <- randomForest(data_matrix, label_vector) 
pred <- predict(rf_object, test_data_matrix) 

मेरी समस्या को पढ़ने में आपके समय के लिए धन्यवाद! मैंने इसके लिए लंबे समय तक सर्फिंग बिताई है। आपके सुझाव/सलाह के लिए धन्यवाद।

उत्तर

13

आप कक्षा की संभावनाओं को आउटपुट क्यों नहीं करते? इस तरह, आपके पास अपनी भविष्यवाणियों की रैंकिंग है और आप किसी भी आरओसी पैकेज को सीधे इनपुट कर सकते हैं।

m = randomForest(data_matrix, labels) 
predict(m,newdata_matrix,type='prob') 

ध्यान दें कि, एक वर्गीकरण उपकरण के रूप में उपयोग करने के लिए randomForest, labels कारक का एक वेक्टर होना चाहिए।

संबंधित मुद्दे