2008-08-04 16 views
24

मैं सोच रहा था कि स्पैम और टेक्स्ट वर्गीकरण के लिए बेयसियन फ़िल्टरिंग का कोई अच्छा और साफ ऑब्जेक्ट उन्मुख प्रोग्रामिंग (ओओपी) कार्यान्वयन है या नहीं? यह सिर्फ सीखने के उद्देश्यों के लिए है।ऑब्जेक्ट ओरिएंटेड बेयसियन स्पैम फ़िल्टरिंग?

उत्तर

12

का चेक बाहर अध्याय 6 मैं निश्चित रूप से Weka की सलाह देते हैं जो एक मुक्त स्रोत डाटा माइनिंग सॉफ्टवेयर लिखा है खोजने के लिए सक्षम होना चाहिए जावा में:

वीका डेटा खनन कार्यों के लिए मशीन लर्निंग एल्गोरिदम का संग्रह है। एल्गोरिदम या तो सीधे डेटासेट पर लागू किया जा सकता है या अपने स्वयं के जावा कोड से बुलाया जा सकता है। वेका में डेटा प्री-प्रोसेसिंग, वर्गीकरण, रिग्रेशन, क्लस्टरिंग, एसोसिएशन नियम, और विज़ुअलाइज़ेशन के लिए टूल शामिल हैं। यह नई मशीन लर्निंग स्कीम विकसित करने के लिए भी उपयुक्त है।

ऊपर उल्लेख किया है, यह, अनुभवहीन Bayes (बेशक) SVM, Winnow, C4.5 की तरह अलग अलग classifiers के एक गुच्छा और कई और अधिक (API doc देखें) के साथ जहाजों। ध्यान दें कि बहुत से वर्गीकरण स्पैम पहचान या टेक्स्ट वर्गीकरण के क्षेत्र में Naive Bayes की तुलना में बहुत बेहतर perfomance के लिए जाने जाते हैं।

इसके अलावा Weka आप लाता है एक बहुत ही powerful GUI ...

2

यहां सी #: A Naive Bayesian Spam Filter for C# (कोडप्रोजेक्ट पर होस्ट किया गया) में बेयसियन फ़िल्टरिंग का कार्यान्वयन है।

2

nBayes - एक और सी # कार्यान्वयन CodePlex

पर होस्ट
संबंधित मुद्दे