2011-03-21 26 views
11

के लिए भाषा मॉडल की परेशानी की गणना करना मेरे पास ईमेल के एक कॉर्पस से सबसे अधिक बार चलने वाले यूनी-ग्राम का एक सेट सेट है। मैं परीक्षण ईमेल में किसी भी शब्द के अवसर/अनुपस्थिति के आधार पर c5.0 का उपयोग करके ईमेल वर्गीकृत करने के लिए इसका उपयोग कर रहा हूं।ईमेल वर्गीकरण

अब मुझे सुविधा सेट में शर्तों की परेशानी की गणना करने और ईमेल वर्गीकृत करने के लिए इसका उपयोग करने की आवश्यकता है। मैं सोच रहा था कि भाषा मॉडलिंग में किसी को भी कोई अनुभव है, और जानता है कि मैं मॉडल की परेशानी की गणना करने के बारे में कैसे जाऊंगा, कोई मदद महान होगी!

मुझे यह जोड़ना चाहिए कि मुझे ऐसे उपकरणों के बारे में पता है जो मेरे लिए यह स्वचालित रूप से कर सकते हैं, उदाहरण के लिए एसआरआईएलएम/सीएमयू-एलएमओटीओएलआईटी, लेकिन मैं इसे अपने अंतिम वर्ष परियोजना के हिस्से के रूप में जमीन से ऊपर कर दूंगा! मुझे बस शुरू करने के तरीके पर संकेत देने की ज़रूरत है ... शायद "बेवकूफ गणना और परेशानी का उपयोग करके वर्गीकरण के लिए बेवकूफों गाइड" का एक लिंक !!

बहुत बहुत धन्यवाद !!

+1

है OT: अपने ही विकलता अभी चार्ट प्रश्न पढ़ने बंद हो गई। पढ़ने के लिए कुछ है :) – sehe

+0

हाहा, माफी माँग थोड़ी देर तक! लेकिन मुझे लगता है कि उन सभी को कहा जाना चाहिए ... मैं यह देखने के लिए मर रहा हूं कि कोई इसे आसानी से समझा सकता है !! –

उत्तर

2

यह CMU course exercise ऐसा लगता है जो आप चाहते हैं। हां, वे आपको एसआरआईएलएम का उपयोग करने की सलाह देते हैं, लेकिन "भाषा मॉडल" अनुभाग देखें - यह एक पुस्तक अध्याय, माइक्रोसॉफ्ट रिसर्च से एक ट्यूटोरियल और उस ट्यूटोरियल के लिए एक प्रस्तुति को इंगित करता है।

आशा है कि इससे मदद मिलती है!

+0

धन्यवाद दस लाख, वह पुस्तक अध्याय सही है। मैं पहले से ही गुगलिंग के पिछले कुछ दिनों में व्याख्यान में आया था, लेकिन पुस्तक एक बहुत अच्छा उदाहरण देता है। एक बार फिर धन्यवाद!! –

+0

लिंक टूटे हैं। आपके द्वारा वर्णित पुस्तक स्पोकन भाषा प्रसंस्करण है? – Thorn

1

मुझे पता है जब से तुम प्रश्न पूछा यह एक समय हो गया है, लेकिन मामले में आप अभी भी परेशानी के व्यापक दायरे में रुचि रखते हैं (मेरा मतलब है प्राकृतिक भाषा प्रसंस्करण, भाषण मान्यता, भाषण टैगिंग का हिस्सा और नाम इकाई पहचान आदि), तो मैं आपको सलाह देता हूं कि आप इस पाठ्यक्रम को वर्तमान में Coursera पर चल रहे हैं।

यहाँ यूआरएल https://www.coursera.org/course/nlangp

संबंधित मुद्दे