2011-12-09 17 views
21

vim में विकिपीडिया से एक कॉपी-पेस्ट करने के बाद, मैं इस:विम: विशेष वर्णों को कैसे खोजें/बदलें?

1 A 
    2 
    3 [+] Métier agricole<200e> – 44 P • 2 C 
    4 [×] Métier de l'ameublement<200e> – 10 P 
    5 [×] Métier de l'animation<200e> – 5 P 
    6 [+] Métier en rapport avec l'art<200e> – 11 P • 4 C 
    7 [×] Métier en rapport avec l'automobile<200e> – 10 P 
    8 [×] Métier de l'aéronautique<200e> – 15 P 

समस्या यह है कि <200e> केवल एक चार है।

मैं चाहूँगा पता है कि कैसे (के माध्यम से / या :)/एक खोज में रख बदलने के लिए।

+0

क्या पेज यह वैसे भी है? –

उत्तर

23

चेक \%u के लिए मदद:

 
           /\%d /\%x /\%o /\%u /\%U E678 

\%d123 Matches the character specified with a decimal number. Must be 
     followed by a non-digit. 
\%o40 Matches the character specified with an octal number up to 0377. 
     Numbers below 040 must be followed by a non-octal digit or a non-digit. 
\%x2a Matches the character specified with up to two hexadecimal characters. 
\%u20AC Matches the character specified with up to four hexadecimal 
     characters. 
\%U1234abcd  Matches the character specified with up to eight hexadecimal 
     characters. 

इन दृश्यों का उपयोग कर सकते हैं। ऐसा लगता है कि आपके पास दो बाइट हैं, इसलिए \%u200e इसे मेल खाना चाहिए। वैसे भी, यह बहुत अजीब है। यूटीएफ -8/एएससीआईआई में 20 अंतरिक्ष चरित्र है, और 0e^एन है। अपनी एन्कोडिंग सेटिंग्स की जांच करें।

+1

'u uee' को utf-8 में '\ x20 \ x0e' के रूप में एन्कोड नहीं किया गया है, इसे * तीन * बाइट्स \ xE2 \ x80 \ x8E' के रूप में एन्कोड किया गया है, आप इसे' echo" \ u200E चलाकर परीक्षण कर सकते हैं " # "\ xE2 \ x80 \ x8E" ': यदि आपके पास 'utf-8' के बराबर 'एन्कोडिंग' विकल्प है तो यह आउटपुट 1 होगा। इसलिए, इस अनुक्रम में अंतरिक्ष या नई लाइन के साथ कोई संबंध नहीं है। – ZyX

+0

धन्यवाद @ ज़ीएक्स, अब बहुत स्पष्ट है। मुझे यूटीएफ -8 के बारे में अधिक जानने के लिए एक पल समर्पित करना चाहिए, मैं अक्सर इसे समझने के बिना यहां और वहां का सामना कर रहा हूं। यदि आप किसी भी दस्तावेज़ को जानते हैं जो इस विषय में पढ़ा जाना चाहिए तो कृपया मुझे बताएं। – sidyll

+0

@ZyX जिस तरह से मुझे लगता है कि '\ u202E' के लिए वास्तविक एन्कोडिंग' \ xE2 \ x80 \ xAE' है (मैं अब थोड़ा सा देखना शुरू कर रहा हूं) – sidyll

4

आप जल्दी से इस बाहरी चरित्र हर जगह का चयन करके उसे बदलना चाहते हैं/यह से छुटकारा पाने के आप:

  1. से पहले और यह बाद में एक रिक्ति जोड़कर अजीब पात्रों में से एक को अलग-थलग, तो यह हो जाता है एक "शब्द"
  2. कर्सर के नीचे शब्द खोजने के लिए * कमांड का उपयोग करें। यदि आपके पास set hlsearch है, तो आपको हाइलाइट किए गए बाहरी वर्ण की सभी घटनाओं को देखना चाहिए।
  3. पिछले कुछ और से आइटम की खोज की जगह, विश्व स्तर पर: :%s//something else/
संबंधित मुद्दे