यादृच्छिकता से वर्गीकरण के लिए आरओसी वक्र

मैं वर्गीकरण कार्य के लिए आर प्लेटफ़ॉर्म में randomForest पैकेज का उपयोग कर रहा हूं।यादृच्छिकता से वर्गीकरण के लिए आरओसी वक्र

rf_object<-randomForest(data_matrix, label_factor, cutoff=c(k,1-k))

जहां के 0.1 से 0.9 तक है।

pred <- predict(rf_object,test_data_matrix)

मेरे पास यादृच्छिक वन वर्गीकरण से आउटपुट है और मैंने इसे लेबल के साथ तुलना की है। इसलिए, मेरे पास 9 कटऑफ पॉइंट्स के लिए सटीकता, एमसीसी, संवेदनशीलता, विशिष्टता इत्यादि जैसे प्रदर्शन उपायों हैं।

अब, मैं आरओसी वक्र को साजिश करना चाहता हूं और आरओसी वक्र के तहत क्षेत्र प्राप्त करना चाहता हूं ताकि यह देखने के लिए कि प्रदर्शन कितना अच्छा है। आर (जैसे आरओसीआर, पीआरओसी) में अधिकांश पैकेज भविष्यवाणी और लेबल की आवश्यकता होती है लेकिन मेरे पास संवेदनशीलता (टीपीआर) और विशिष्टता (1-एफपीआर) है।

क्या कोई मुझे सुझाव दे सकता है कि कटऑफ विधि आरओसी वक्र का उत्पादन करने के लिए सही या विश्वसनीय है या नहीं? क्या आप टीपीआर और एफपीआर का उपयोग कर वक्र के तहत आरओसी वक्र और क्षेत्र प्राप्त करने के किसी भी तरीके से जानते हैं?

मैंने यादृच्छिक जंगल को प्रशिक्षित करने के लिए निम्न आदेश का उपयोग करने का भी प्रयास किया। इस तरह भविष्यवाणियां निरंतर थीं और आर में ROCR और pROC पैकेजों के लिए स्वीकार्य थीं, लेकिन मुझे यकीन नहीं है कि यह करने का सही तरीका है या नहीं। क्या कोई मुझे इस विधि के बारे में सुझाव दे सकता है?

rf_object <- randomForest(data_matrix, label_vector) 
pred <- predict(rf_object, test_data_matrix)

मेरी समस्या को पढ़ने में आपके समय के लिए धन्यवाद! मैंने इसके लिए लंबे समय तक सर्फिंग बिताई है। आपके सुझाव/सलाह के लिए धन्यवाद।

स्रोत

2012-09-11 Abhishek

आप कक्षा की संभावनाओं को आउटपुट क्यों नहीं करते? इस तरह, आपके पास अपनी भविष्यवाणियों की रैंकिंग है और आप किसी भी आरओसी पैकेज को सीधे इनपुट कर सकते हैं।

m = randomForest(data_matrix, labels) 
predict(m,newdata_matrix,type='prob')

ध्यान दें कि, एक वर्गीकरण उपकरण के रूप में उपयोग करने के लिए randomForest, labels कारक का एक वेक्टर होना चाहिए।

स्रोत

2012-09-18 12:16:36 jey1401

यादृच्छिकता से वर्गीकरण के लिए आरओसी वक्र

उत्तर

संबंधित मुद्दे