2010-05-13 10 views
11

मैं कैसे नियमित रूप से उद्धरण के लिए एमएस वर्ड उद्धरण और अक्षर लोप बदलने और जावा में अक्षर अक्षर लोप हो? इन पात्रों के लिए यूनिकोड संख्या क्या है?परिवर्तित एमएस शब्द उद्धरण और अक्षर लोप

अर्थात, "आप कैसे कर रहे हो?" 'कैसे हो'

करने के लिए "आप कैसे कर रहे हो?" 'कैसे हो'

धन्यवाद

संपादित करें: ऐसा लगता है कि पहले से ही stackoverflow नियमित उद्धरण और अक्षर लोप करने के लिए इसे परिवर्तित कर रहा है ... कैसे मैं जावा में एक ही पूरा करते हैं? Unicode codepoint lookup/search tool:

+0

यहां परिवर्तित नहीं किया गया है, 'स्मार्ट कोट्स' ठीक हैं। StackOverflow प्रश्न उद्धरण (विवादास्पद) में सीधे उद्धरणों को परिवर्तित करता है, लेकिन अकेले सवाल टेक्स्ट छोड़ देता है। – bobince

+0

संयोग से, क्या वास्तव में सीधे उद्धरणों के साथ उन्हें बदलने का एक अच्छा कारण है? वे विशेष "एमएस वर्ड" वर्ण नहीं हैं, वे पूरी तरह से यूनिकोड वर्ण मान्य हैं जिन्हें आम तौर पर यूनिकोड को संभालने वाले किसी भी एप्लिकेशन द्वारा ठीक से संभाला जाना चाहिए। – bobince

+0

@bobince सभी अनुप्रयोगों को यूनिकोड ठीक तरह से संभाल नहीं लेता है, लेकिन अक्सर लोग एमएस-शब्द में लिखे गए पाठ को पेस्ट करते हैं और उद्धरण (उन्हें नियमित रूप से उद्धृत करके) को पूरी तरह से बाहर निकालने में सक्षम होना अच्छा होता है। – dan

उत्तर

9

यहाँ हर किसी को यूनिकोड से निपटने के लिए एक बहुत ही उपयोगी लिंक भी है।

"उद्धरण चिह्न" की खोज की देता

‘ (U+2018) LEFT SINGLE QUOTATION MARK 
’ (U+2019) RIGHT SINGLE QUOTATION MARK 
“ (U+201C) LEFT DOUBLE QUOTATION MARK 
” (U+201D) RIGHT DOUBLE QUOTATION MARK 

several other quote-like symbols है कि आप की जगह पर विचार हो सकता हैं।

+1

:-( – mjaggard

+3

धन्यवाद टूटी लिंक, यह तय की। :-) :-) – Thomas

+1

धन्यवाद। क्या कोई साधारण कोड नहीं है जो सभी एमएस वर्ड कोट्स को सीधे उद्धरण चिह्नों के साथ बदल देता है? मेरा मतलब है, हम सभी एमएस वर्ड उद्धरणों को कैसे सूचीबद्ध कर सकते हैं? – mjaggard

11

थॉमस के जवाब बंद जा रहे हैं, कोड है:

return text.replaceAll("[\\u2018\\u2019]", "'") 
      .replaceAll("[\\u201C\\u201D]", "\""); 
4

C# How to replace Microsoft's Smart Quotes with straight quotation marks?

यहाँ पर धन्यवाद निक को वैन Esch है कोड ('\ u2019' एमएस वर्ड में 'है), क्योंकि उपयोगी है इसमें समस्याग्रस्त शब्द वर्ण शामिल हैं।

if (buffer.IndexOf('\u2013') > -1) buffer = buffer.Replace('\u2013', '-'); 
if (buffer.IndexOf('\u2014') > -1) buffer = buffer.Replace('\u2014', '-'); 
if (buffer.IndexOf('\u2015') > -1) buffer = buffer.Replace('\u2015', '-'); 
if (buffer.IndexOf('\u2017') > -1) buffer = buffer.Replace('\u2017', '_'); 
if (buffer.IndexOf('\u2018') > -1) buffer = buffer.Replace('\u2018', '\''); 
if (buffer.IndexOf('\u2019') > -1) buffer = buffer.Replace('\u2019', '\''); 
if (buffer.IndexOf('\u201a') > -1) buffer = buffer.Replace('\u201a', ','); 
if (buffer.IndexOf('\u201b') > -1) buffer = buffer.Replace('\u201b', '\''); 
if (buffer.IndexOf('\u201c') > -1) buffer = buffer.Replace('\u201c', '\"'); 
if (buffer.IndexOf('\u201d') > -1) buffer = buffer.Replace('\u201d', '\"'); 
if (buffer.IndexOf('\u201e') > -1) buffer = buffer.Replace('\u201e', '\"'); 
if (buffer.IndexOf('\u2026') > -1) buffer = buffer.Replace("\u2026", "..."); 
if (buffer.IndexOf('\u2032') > -1) buffer = buffer.Replace('\u2032', '\''); 
if (buffer.IndexOf('\u2033') > -1) buffer = buffer.Replace('\u2033', '\"'); 
+0

ऊपर जवाब में, हम सभी एमएस वर्ड उद्धरण का उल्लेख कर रहे हैं –

+0

@ अनीश मित्तल: जहां तक ​​मुझे पता है, यह सबसे आसान तरीका है। – 123iamking

संबंधित मुद्दे