2017-04-18 3 views
14

उदाहरण: กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิ ิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ (या किसी भी "zalgo" पाठ)कैसे जांचें कि किसी संदेश में एक संयुक्त चरित्र है या नहीं?

मैं काफी इन के लिए जाँच करने के लिए किसी भी तरह से यह पता लगाने के लिए सक्षम नहीं किया गया। मैं एक प्रकार का एंटीस्पाम बना रहा हूं और मुझे इन्हें रखने की आवश्यकता नहीं दिख रही है क्योंकि वे उपयोगकर्ताओं को अंतराल कर सकते हैं और आमतौर पर स्पैम है।

मुझे क्या करना कोशिश कर रहा हूँ

if (getMessage().getRawContent().contains(combined character).delete(); 

किसी को भी संयुक्त वर्ण पोस्ट करें जांच करने के लिए एक आसान तरीका जानता है है!

यदि आप जो पूछ रहे हैं उस पर आप उलझन में हैं तो मैं इसे और समझा सकता हूं और यदि आवश्यक हो तो अधिक उदाहरण दिखा सकता हूं।

+0

क्या यह केवल मेरा ब्राउज़र है या सवाल यह है कि यह तरीका http://imgur.com/a/zNR17 है? अजीब एएफ ओओ –

+4

@ जॉर्ज कॉम्पोस मुझे यकीन है कि यह जानबूझकर है। सवाल यह पूछ रहा है कि संयोजन अक्षरों के दुरुपयोग का पता कैसे लगाया जाए। – VGR

+1

@Jorge: मेरा भी है, और मान लें: क्या एक बहुत अच्छा हैक! वादे ** अधिक उदाहरण ** की प्रतीक्षा कर रहा है। हाँ, हमें चाहिए! – statosdotcom

उत्तर

11

ऐसे कई मामले हैं जहां एक या दो लगातार संयोजन वर्ण पूरी तरह मान्य टेक्स्ट हैं। मैं उनमें से चार या अधिक की तलाश करूंगा:

if (getMessage().getRawContent().matches(".*\\p{Mn}{4}.*")) 
+0

हाँ सच है, मैं इस बाहर कोशिश करते हैं और परिणाम के साथ वापस आ जाएगा! –

+0

, पूरी तरह से काम किया धन्यवाद एक टन! –

संबंधित मुद्दे