के बाहर जावा रेगेक्स मैच वर्ण जावा में यूनिकोड बेसिक बहुभाषी विमान के बाहर से मैं पात्रों (उन्हें हटाने के इरादे से) कैसे मिलान कर सकता हूं?मूल बहुभाषी विमान
15
A
उत्तर
19
सभी गैर-बीएमपी वर्ण निकालने के लिए, निम्न कार्य करना चाहिए:
String sanitizedString = inputString.replaceAll("[^\u0000-\uFFFF]", "");
3
क्या आप बीएमपी के बाहर विशिष्ट पात्रों या सभी पात्रों की तलाश में हैं?
पूर्व, तो आप एक स्ट्रिंग अधिक विमानों से कोड अंक युक्त निर्माण करने के लिए एक StringBuilder
उपयोग कर सकते हैं, और regex अपेक्षा के अनुरूप काम करेगा:
String test = new StringBuilder().append("test").appendCodePoint(0x10300).append("test").toString();
Pattern regex = Pattern.compile(new StringBuilder().appendCodePoint(0x10300).toString());
Matcher matcher = regex.matcher(test);
matcher.find();
System.out.println(matcher.start());
आप निकालना सभी गैर देख रहे हैं एक स्ट्रिंग से -BMP वर्ण, तो मैं regex से StringBuilder
प्रयोग करेंगे सीधे नहीं बल्कि:
StringBuilder sb = new StringBuilder(test.length());
for (int ii = 0 ; ii < test.length() ;)
{
int codePoint = test.codePointAt(ii);
if (codePoint > 0xFFFF)
{
ii += Character.charCount(codePoint);
}
else
{
sb.appendCodePoint(codePoint);
ii++;
}
}
संबंधित मुद्दे
- 1. जावा में यूनिकोड पूरक बहुभाषी विमान
- 2. बहुभाषी
- 3. विमान
- 4. विंडोज़ में, आप यूनिकोड बेसिक बहुभाषी विमान के बाहर एक चरित्र कैसे दर्ज करते हैं?
- 5. विंडोज़ wchar_t बुनियादी बहुभाषी विमान के बाहर यूनिकोड वर्णों को कैसे संभालता है?
- 6. बहुभाषी साइट
- 7. बहुभाषी साइट
- 8. Drupal बहुभाषी
- 9. बहुभाषी वेबसाइट
- 10. बहुभाषी डेटाबेस
- 11. बहुभाषी PHP वेबसाइट
- 12. थ्री.जेएस - एकाधिक सामग्री विमान
- 13. 2 डी विमान
- 14. रे और विमान
- 15. विमान और बिंदु
- 16. 2 डी विमान
- 17. बहुभाषी एक्सप्रेस ऐप
- 18. PHP - बहुभाषी अनुप्रयोग डिजाइन
- 19. पीओडी बहुभाषी दस्तावेज़ीकरण
- 20. सचमुच बहुभाषी प्रोग्रामिंग भाषाएं?
- 21. बहुभाषी wpf अनुप्रयोग
- 22. सरल बहुभाषी सीएमएस?
- 23. एक बहुभाषी WPF अनुप्रयोग
- 24. Codeigniter बहुभाषी और एसईओ
- 25. विमान के 3 डी रोटेशन
- 26. विमान में क्लोज-पैकिंग अंक?
- 27. कोडइग्निटर यूआरआई रूटिंग (गतिशील, बहुभाषी)
- 28. बहुभाषी डेटा कैसे स्टोर करें?
- 29. बहुभाषी WordPress ... कौन सा प्लगइन?
- 30. अंक के विमान को टेस्सेलेट करें
क्या आपने वास्तव में इसका परीक्षण किया है? चूंकि आपके चरित्र श्रेणी में गैर-बीएमपी कोडपॉइंट्स बनाने के लिए उपयोग की जाने वाली सरोगेट रेंज शामिल है। – Anon
@Anon: जैसा कि आपने अपने उत्तर में बताया है, कोडपॉइंट्स के स्तर पर रेगेक्सप्स का मूल्यांकन किया जाता है, कोड कोड नहीं, इसलिए यह सरोगेट्स नहीं देखता है। – axtavt
हां, यह गैर-बीएमपी पात्रों के साथ परीक्षण किया गया है। –