मुझे मोबाइल डिवाइस से टेक्स्ट इनपुट मिला है। इसमें इमोजी है। सी # में, मैं पाठ के रूप मेंमैं स्ट्रिंग से इमोजी वर्ण कैसे हटा सकता हूं?
Text text
सीधे शब्दों में कहें, मैं उत्पादन पाठ
Text text
मैं सिर्फ rejex के साथ पाठ से ऐसे सभी emojis दूर करने के लिए कोशिश कर रहा हूँ होना चाहता हूँ .. सिवाय इसके कि, मुझे यकीन नहीं है कि उस इमोजी को इसके यूनिकोड अनुक्रम में कैसे परिवर्तित करें .. मैं यह कैसे कर सकता हूं?
संपादित करें:
मैं mysql में उपयोगकर्ता इनपुट को बचाने के लिए कोशिश कर रहा हूँ। ऐसा लगता है कि MySQL UTF8 वास्तव में यूनिकोड वर्णों और right way to do it would be by changing the schema का समर्थन नहीं करता है, लेकिन मुझे नहीं लगता कि यह मेरे लिए एक विकल्प है। इसलिए मैं इसे डेटाबेस में सहेजने से पहले सभी इमोजी वर्णों को हटाने की कोशिश कर रहा हूं।
मैं अपने ORM और डालने क्वेरी के रूप में Nhibernate उपयोग कर रहा हूँ इस तरह दिखता है उत्पन्न:
Insert into `Content` (ContentTypeId, Comments, DateCreated)
values (?p0, ?p1, ?p2);
?p0 = 4 [Type: Int32 (0)]. ?p1 = 'Text text' [Type: String (20)], ?p2 = 19/01/2015 10:38:23 [Type: DateTime (0)]
जब मैं इस कॉपी
यह प्रासंगिक स्तंभ के लिए मेरी स्कीमा है लॉग से क्वेरी करें और इसे सीधे mysql पर चलाएं, मुझे यह त्रुटि मिलती है:
1 warning(s): 1366 Incorrect string value: '\xF0\x9F\x98\x80 t...' for column 'Comments' at row 1 0.000 sec
इसके अलावा, मैं यह एन्कोडिंग बाइट्स में परिवर्तित करने की कोशिश की है और यह वास्तव में काम नहीं करता है ..
यह वास्तव में स्पष्ट नहीं है कि आप क्या हासिल करने का प्रयास कर रहे हैं - वर्णों को बदलने के बाद आप स्ट्रिंग मान के साथ क्या करेंगे? –
@ जोन्स स्केट ने पोस्ट संपादित किया, धन्यवाद। – LocustHorde
यूटीएफ -8 वास्तव में * ठीक होना चाहिए *। क्या आप अपनी स्कीमा जानकारी के साथ डेटा को सहेजने की कोशिश कर रहे हैं, इस बारे में विवरण पोस्ट कर सकते हैं? –