आर

2013-03-02 4 views
24

में स्ट्रिंग से कुछ वर्णों को हटा रहा है मेरे पास आर में एक स्ट्रिंग है जिसमें बड़ी मात्रा में शब्द हैं।आर

>docs 

.... 

\u009cYes yes for ever for ever the boys cried in their ringing voices with softened faces 

.... 

तो मैं इन \ u009 वर्ण (उन सभी को, जिनमें से कुछ थोड़ा अलग नंबर हैं निकालने का तरीका सोच रहा हूँ: जब स्ट्रिंग को देखने मैं पाठ की एक बड़ी राशि है जो निम्न के समान पाठ भी शामिल है मिल) स्ट्रिंग से। मैंने gsub() का उपयोग करने का प्रयास किया है, लेकिन यह तारों से सामग्री को हटाने में प्रभावी नहीं था।

उत्तर

40

यह काम करना चाहिए

gsub('\u009c','','\u009cYes yes for ever for ever the boys ') 
"Yes yes for ever for ever the boys " 

यहाँ 009c यूनिकोड का हेक्साडेसिमल संख्या है। आपको हमेशा 4 हेक्साडेसिमल अंक निर्दिष्ट करना होगा। आप कई है, तो एक ही समाधान एक पाइप से उन्हें अलग करने के लिए है:

gsub('\u009c|\u00F0','','\u009cYes yes \u00F0for ever for ever the boys and the girls') 

"Yes yes for ever for ever the boys and the girls" 
+0

धन्यवाद, यह यह काम कर रहा मिला है। –

+1

"आपको हमेशा 4 अंक निर्दिष्ट करना होगा": यह केवल यूनिकोड करते समय ही होता है। यह रिक्त स्थान और डैश को ठीक से हटा देना चाहिए: 'gsub ('| -', '', '1-444-654')' – Zak