ईमेल वर्गीकरण

के लिए भाषा मॉडल की परेशानी की गणना करना मेरे पास ईमेल के एक कॉर्पस से सबसे अधिक बार चलने वाले यूनी-ग्राम का एक सेट सेट है। मैं परीक्षण ईमेल में किसी भी शब्द के अवसर/अनुपस्थिति के आधार पर c5.0 का उपयोग करके ईमेल वर्गीकृत करने के लिए इसका उपयोग कर रहा हूं।ईमेल वर्गीकरण

अब मुझे सुविधा सेट में शर्तों की परेशानी की गणना करने और ईमेल वर्गीकृत करने के लिए इसका उपयोग करने की आवश्यकता है। मैं सोच रहा था कि भाषा मॉडलिंग में किसी को भी कोई अनुभव है, और जानता है कि मैं मॉडल की परेशानी की गणना करने के बारे में कैसे जाऊंगा, कोई मदद महान होगी!

मुझे यह जोड़ना चाहिए कि मुझे ऐसे उपकरणों के बारे में पता है जो मेरे लिए यह स्वचालित रूप से कर सकते हैं, उदाहरण के लिए एसआरआईएलएम/सीएमयू-एलएमओटीओएलआईटी, लेकिन मैं इसे अपने अंतिम वर्ष परियोजना के हिस्से के रूप में जमीन से ऊपर कर दूंगा! मुझे बस शुरू करने के तरीके पर संकेत देने की ज़रूरत है ... शायद "बेवकूफ गणना और परेशानी का उपयोग करके वर्गीकरण के लिए बेवकूफों गाइड" का एक लिंक !!

बहुत बहुत धन्यवाद !!

स्रोत

2011-03-21 B. Bowles

है OT: अपने ही विकलता अभी चार्ट प्रश्न पढ़ने बंद हो गई। पढ़ने के लिए कुछ है :) – sehe

हाहा, माफी माँग थोड़ी देर तक! लेकिन मुझे लगता है कि उन सभी को कहा जाना चाहिए ... मैं यह देखने के लिए मर रहा हूं कि कोई इसे आसानी से समझा सकता है !! –

यह CMU course exercise ऐसा लगता है जो आप चाहते हैं। हां, वे आपको एसआरआईएलएम का उपयोग करने की सलाह देते हैं, लेकिन "भाषा मॉडल" अनुभाग देखें - यह एक पुस्तक अध्याय, माइक्रोसॉफ्ट रिसर्च से एक ट्यूटोरियल और उस ट्यूटोरियल के लिए एक प्रस्तुति को इंगित करता है।

आशा है कि इससे मदद मिलती है!

स्रोत

2011-03-23 11:08:08

धन्यवाद दस लाख, वह पुस्तक अध्याय सही है। मैं पहले से ही गुगलिंग के पिछले कुछ दिनों में व्याख्यान में आया था, लेकिन पुस्तक एक बहुत अच्छा उदाहरण देता है। एक बार फिर धन्यवाद!! –

लिंक टूटे हैं। आपके द्वारा वर्णित पुस्तक स्पोकन भाषा प्रसंस्करण है? – Thorn

लिंक करने के लिए यहोशू गुडमैन (एमएस रिसर्च से turorial) द्वारा "कला भाषा मॉडलिंग के राज्य" अब है: http://research.microsoft.com/apps/pubs/default.aspx?id=68595

स्रोत

2013-03-13 15:41:20

मुझे पता है जब से तुम प्रश्न पूछा यह एक समय हो गया है, लेकिन मामले में आप अभी भी परेशानी के व्यापक दायरे में रुचि रखते हैं (मेरा मतलब है प्राकृतिक भाषा प्रसंस्करण, भाषण मान्यता, भाषण टैगिंग का हिस्सा और नाम इकाई पहचान आदि), तो मैं आपको सलाह देता हूं कि आप इस पाठ्यक्रम को वर्तमान में Coursera पर चल रहे हैं।

यहाँ यूआरएल https://www.coursera.org/course/nlangp

स्रोत

2013-03-18 16:01:09

ईमेल वर्गीकरण

उत्तर

संबंधित मुद्दे