ऑब्जेक्ट ओरिएंटेड बेयसियन स्पैम फ़िल्टरिंग?

मैं सोच रहा था कि स्पैम और टेक्स्ट वर्गीकरण के लिए बेयसियन फ़िल्टरिंग का कोई अच्छा और साफ ऑब्जेक्ट उन्मुख प्रोग्रामिंग (ओओपी) कार्यान्वयन है या नहीं? यह सिर्फ सीखने के उद्देश्यों के लिए है।ऑब्जेक्ट ओरिएंटेड बेयसियन स्पैम फ़िल्टरिंग?

स्रोत

2008-08-04 gyurisc

का चेक बाहर अध्याय 6 मैं निश्चित रूप से Weka की सलाह देते हैं जो एक मुक्त स्रोत डाटा माइनिंग सॉफ्टवेयर लिखा है खोजने के लिए सक्षम होना चाहिए जावा में:

वीका डेटा खनन कार्यों के लिए मशीन लर्निंग एल्गोरिदम का संग्रह है। एल्गोरिदम या तो सीधे डेटासेट पर लागू किया जा सकता है या अपने स्वयं के जावा कोड से बुलाया जा सकता है। वेका में डेटा प्री-प्रोसेसिंग, वर्गीकरण, रिग्रेशन, क्लस्टरिंग, एसोसिएशन नियम, और विज़ुअलाइज़ेशन के लिए टूल शामिल हैं। यह नई मशीन लर्निंग स्कीम विकसित करने के लिए भी उपयुक्त है।

ऊपर उल्लेख किया है, यह, अनुभवहीन Bayes (बेशक) SVM, Winnow, C4.5 की तरह अलग अलग classifiers के एक गुच्छा और कई और अधिक (API doc देखें) के साथ जहाजों। ध्यान दें कि बहुत से वर्गीकरण स्पैम पहचान या टेक्स्ट वर्गीकरण के क्षेत्र में Naive Bayes की तुलना में बहुत बेहतर perfomance के लिए जाने जाते हैं।

इसके अलावा Weka आप लाता है एक बहुत ही powerful GUI ...

स्रोत

2008-09-03 19:46:47