मेरी समस्या:तारों के भीतर से छिपे हुए वर्णों को हटाकर
मेरे पास एक .NET एप्लिकेशन है जो ईमेल के माध्यम से न्यूजलेटर भेजता है। जब समाचार पत्रों को दृष्टिकोण में देखा जाता है, तो दृष्टिकोण एक छिपे हुए चरित्र के स्थान पर एक प्रश्न चिह्न प्रदर्शित करता है जिसे पहचान नहीं सकता है। ये छिपे हुए चरित्र अंतिम उपयोगकर्ताओं से आ रहे हैं जो एचटीएमएल की प्रतिलिपि बनाते हैं और पेस्ट करते हैं जो समाचार पत्रों को एक रूप में बनाता है और इसे प्रस्तुत करता है। एक सी # ट्रिम() इन छिपे हुए वर्णों को हटा देता है यदि वे स्ट्रिंग के अंत या शुरुआत में होते हैं। जब न्यूजलेटर जीमेल में देखा जाता है, तो जीमेल उन्हें अनदेखा करने के लिए एक अच्छा काम करता है। इन छिपे हुए अक्षरों को एक शब्द दस्तावेज़ में चिपकाते समय और मैं "अनुच्छेद चिह्न और छिपे प्रतीकों को दिखाएं" विकल्प को चालू करता हूं, प्रतीक एक बड़े आयताकार के अंदर एक आयताकार के रूप में दिखाई देते हैं। न्यूज़लेटर्स को बनाने वाला पाठ भी किसी भी भाषा में हो सकता है, इसलिए यूनिकोड वर्णों को स्वीकार करना जरूरी है। मैंने चरित्र का पता लगाने के लिए स्ट्रिंग के माध्यम से लूपिंग करने की कोशिश की है लेकिन लूप इसे पहचानता नहीं है और इसे पार करता है। यह भी पूछने से पहले अंतिम उपयोगकर्ता को एचटीएमएल को नोटपैड में पेस्ट करने से पहले प्रश्न पूछना है।
मेरा प्रश्न:
सी # का उपयोग करके इन छिपे हुए अक्षरों को मैं कैसे पहचान और खत्म कर सकता हूं?
newString = oldString.Replace("?", "");
जहां:
एक उदाहरण यहाँ रखो .. –
उदाहरण अमान्य मान होगा है कि कर रहे हैं अच्छा। मैं एसिसी पाठ में अपने यूनिकोड तारों का अनुमान लगा रहा हूं, लेकिन फिर यह सिर्फ एक अनुमान है। –
रेगेक्स, केवल अक्षरों को –