2010-12-22 11 views
5

स्पैम का पता लगाने के लिए वर्तमान में सबसे अच्छी विधि क्या है? खासकर मोबाइल टेक्स्ट संदेश पर। कोई संसाधन या तुलना विश्लेषण है?वर्तमान में सबसे अच्छा स्पैम फ़िल्टर एल्गोरिदम

+3

क्या आप प्रोग्रामर या उपयोगकर्ता के परिप्रेक्ष्य से पूछ रहे हैं? यानी क्या आप स्पैम पहचान एल्गोरिदम लागू करना चाहते हैं या आप अपने ईमेल में स्पैम का पता लगाना चाहते हैं? – marcog

+0

मैं प्रोग्रामर या शोधकर्ता परिप्रेक्ष्य से पूछ रहा हूं। मैं एक स्पैम फ़िल्टर को कार्यान्वित करने की कोशिश कर रहा हूं लेकिन वर्तमान में एल्गोरिदम – ahmy

उत्तर

8

पर्यवेक्षित शिक्षण तकनीकों को देखना अच्छा होता है। वहां कई अध्ययन हुए हैं जहां बहुराष्ट्रीय नौसेना बेयस क्लासिफायर का उपयोग स्पैम ईमेल फ़िल्टरिंग के लिए बहुत सफलता के साथ किया गया है। अगर यह स्पैम ईमेल फ़िल्टरिंग के लिए काम करता है, तो उसे एसएमएस फ़िल्टरिंग के साथ काम करना चाहिए। आपको जो चाहिए वह स्पैम एसएमएस ग्रंथों का एक विशाल डेटासेट है और इसके साथ वर्गीकृत को प्रशिक्षित करता है।

इसके अलावा, यह समर्थन वेक्टर मशीन को देखने में सहायक हो सकता है, जो; हालांकि स्पैम फ़िल्टरिंग में कम व्यापक रूप से उपयोग किया जाता है; एक और अधिक शक्तिशाली तकनीक है।

इसके अलावा, कच्चे पाठ पर एल्गोरिदम को प्रशिक्षण देना शायद सबसे अच्छा तरीका नहीं हो सकता है। 1 99 8 से मेहरान साहमी ने एक अध्ययन किया था, जिसमें पाया गया था कि उन्होंने अन्य हेरिस्टिक को ध्यान में रखते हुए बेहतर प्रदर्शन हासिल किया था (उदाहरण के लिए मेलिंग सूची में भेजा गया ईमेल था? क्या एक डोमेन नाम से भेजा गया ईमेल था जो ".edu" , "कॉम", "ओआरजी"? क्या ईमेल में कई विराम चिह्न हैं ("!!!") ?, और बहुत आगे)।

लेकिन बहुराष्ट्रीय बेवकूफ बेयस क्लासिफायरफायर के साथ शुरू करें। इसे कार्यान्वित करना बहुत आसान है, और इसका उपयोग करना बहुत आसान है, और व्यक्तिगत अनुभव से: इसमें बहुत कम प्रशिक्षण समय भी है।

4

जैसा कि मैं समझता हूं कि यह सबसे आधुनिक स्पैम फ़िल्टरिंग Bayes' theorem और कुछ ह्युरिस्टिक्स, के कार्यान्वयन का संयोजन है। प्रेषक ब्लैकलिस्ट, मानक अनुपालन, पैटर्न भेजना।

मोबाइल फोन नेटवर्क में इसे लागू करने का सबसे आसान स्थान शायद SMS message centre पर होगा, क्योंकि वॉल्यूम अधिक है, जिससे बहुत सारे हेरिस्टिक को कार्यान्वित करना आसान हो जाता है।

0

एल्गोरिदम और हेरिस्टिक्स (और "सर्वोत्तम विधि" नहीं) का उपयोग करके अपने नेटवर्क और ग्राहकों को स्पैम, धोखाधड़ी, दुर्भावनापूर्ण सामग्री, साइबर-धमकाने, पहचान चोरी, वायरस इत्यादि से बचाने के लिए एक अच्छा तरीका है।

Cloudmark और यह विभिन्न भागीदारों और प्रतिस्पर्धा को देखना शुरू करने के लिए एक अच्छी जगह है।

-1

तुम क्यों, स्पैम के बाद बात के बाद, prevent it in the बट ... फिर पता लगाने के लिए कली पूर्णांक ... आवश्यकता है

अद्यतन:
फिल्टर को आसानी से और मोटे तौर पर blackhat एसईओ/SEM और अपराधियों द्वारा इस्तेमाल किया जा रहा प्रतियोगियों को ब्लैकलिस्ट/डंप करने के लिए।
इसके अलावा, वे पीछे हटने वाले हैं, इसलिए, स्पैमर तकनीकों की प्रगति के पीछे हमेशा पीछे हटने के लिए

+0

के बारे में खराब जानकारी है क्योंकि ऐसा है क्योंकि मैं अनुप्रयोग क्लाइंट मोबाइल डिवाइस विकसित कर रहा हूं – ahmy

संबंधित मुद्दे