जिस तरह से परिशुद्धता और याद आम तौर पर गणना की जाती है (यही वह है जो मैं अपने कागजात में उपयोग करता हूं) एक दूसरे के खिलाफ इकाइयों को मापना है। जमीनी सच्चाई मान निम्नलिखित (किसी भी differentiaton बिना के रूप में संस्थाओं की किस प्रकार वे कर रहे हैं करने के लिए) है
[Microsoft Corp.] CEO [Steve Ballmer] announced the release of [Windows 7] today
यह 3 इकाइयां हैं।
मान लें कि आपकी वास्तविक निकासी CEO
और today
, Windows 7
के लिए एक झूठी नकारात्मक और Steve
के लिए सबस्ट्रिंग मिलान के लिए निम्नलिखित
[Microsoft Corp.] [CEO] [Steve] Ballmer announced the release of Windows 7 [today]
आप Microsoft Corp
के लिए सटीक मिलान है, झूठे सकारात्मक है हम पहले सटीक मिलान मानदंडों द्वारा परिशुद्धता की गणना करते हैं और याद करते हैं। उदाहरण के लिए, क्या उन्हें एक सटीक मैच होना चाहिए? क्या यह एक मैच है यदि वे बिल्कुल ओवरलैप करते हैं? क्या इकाई प्रकार मायने रखते हैं? आम तौर पर हम इन मानदंडों में से कई के लिए परिशुद्धता प्रदान करते हैं और याद करते हैं।
सटीक मिलान: सच सकारात्मक = 1 (Microsoft Corp.
, केवल सटीक मिलान), झूठी सकारात्मक = 3 (CEO
, today
, और Steve
, जो सटीक मेल नहीं है), मिथ्या नकारात्मक = 2 (Steve Ballmer
और Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 1/(1+3) = 0.25
Recall = True Positives/(True Positives + False Negatives) = 1/(1+2) = 0.33
कोई ओवरलैप ठीक: सच सकारात्मक = 2 (Microsoft Corp.
, और Steve
जो Steve Ballmer
overlaps), झूठी सकारात्मक = 2 (CEO
, और today
), मिथ्या नकारात्मक = 1 (Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 2/(2+2) = 0.55
Recall = True Positives/(True Positives + False Negatives) = 2/(2+1) = 0.66
पाठक तो है कि "वास्तविक प्रदर्शन" अनुमान लगाने के लिए (सटीक छोड़ दिया और याद करते हैं कि एक निष्पक्ष मानव चेकर जब मानव उपयोग करने की अनुमति देना होगा है यह निर्णय लेने का निर्णय कि कौन से ओवरलैप विसंगतियां महत्वपूर्ण हैं, और जो नहीं हैं) दोनों के बीच कहीं है।
यह भी अक्सर एफ 1 उपाय है, जो सटीक और याद का हरात्मक माध्य है रिपोर्ट करने के लिए उपयोगी है, और जो आप याद करते हैं के खिलाफ सटीक बंद व्यापार करने के लिए है जब "प्रदर्शन" के कुछ विचार देता है।
+1! – KillBill
ग्रेट उत्तर। प्रश्न: इस संदर्भ में "सही नकारात्मक" का क्या अर्थ है? सटीकता की गणना करने के लिए इसकी आवश्यकता है, मुझे विश्वास है। –
मान लीजिए कि मैं दूसरी रणनीति के अनुसार मूल्यांकन करता हूं (ओवरलैप ठीक है)। [स्टीव] [Ballmer] जैसी स्थितियों से निपटने के लिए कैसे? दोनों (आंशिक) मैचों के रूप में गणना की गई वास्तविक सकारात्मक कैसे हैं? –