के लिए भाषा मॉडल की परेशानी की गणना करना मेरे पास ईमेल के एक कॉर्पस से सबसे अधिक बार चलने वाले यूनी-ग्राम का एक सेट सेट है। मैं परीक्षण ईमेल में किसी भी शब्द के अवसर/अनुपस्थिति के आधार पर c5.0 का उपयोग करके ईमेल वर्गीकृत करने के लिए इसका उपयोग कर रहा हूं।ईमेल वर्गीकरण
अब मुझे सुविधा सेट में शर्तों की परेशानी की गणना करने और ईमेल वर्गीकृत करने के लिए इसका उपयोग करने की आवश्यकता है। मैं सोच रहा था कि भाषा मॉडलिंग में किसी को भी कोई अनुभव है, और जानता है कि मैं मॉडल की परेशानी की गणना करने के बारे में कैसे जाऊंगा, कोई मदद महान होगी!
मुझे यह जोड़ना चाहिए कि मुझे ऐसे उपकरणों के बारे में पता है जो मेरे लिए यह स्वचालित रूप से कर सकते हैं, उदाहरण के लिए एसआरआईएलएम/सीएमयू-एलएमओटीओएलआईटी, लेकिन मैं इसे अपने अंतिम वर्ष परियोजना के हिस्से के रूप में जमीन से ऊपर कर दूंगा! मुझे बस शुरू करने के तरीके पर संकेत देने की ज़रूरत है ... शायद "बेवकूफ गणना और परेशानी का उपयोग करके वर्गीकरण के लिए बेवकूफों गाइड" का एक लिंक !!
बहुत बहुत धन्यवाद !!
है OT: अपने ही विकलता अभी चार्ट प्रश्न पढ़ने बंद हो गई। पढ़ने के लिए कुछ है :) – sehe
हाहा, माफी माँग थोड़ी देर तक! लेकिन मुझे लगता है कि उन सभी को कहा जाना चाहिए ... मैं यह देखने के लिए मर रहा हूं कि कोई इसे आसानी से समझा सकता है !! –