मैं टर्मिनल पर टेक्स्ट फ़ाइलों के समूह से यूनिकोड वर्ण कैसे हटा सकता हूं? मैं इस की कोशिश की है, लेकिन यह काम नहीं किया:टेक्स्टफाइल से यूनिकोड वर्ण हटाएं - sed, अन्य bash/shell विधियों
iconv -f utf8 -t ascii//TRANSLIT </tmp/utf8_input.txt> /tmp/ascii_output.txt
यह वर्ण अनुवाद करेगा:
sed 'g/\u'U+200E'//' -i *.txt
मैं textfiles से इन unicodes दूर करने के लिए
U+0091 - sort of weird "control" space
U+0092 - same sort of weird "control" space
A0 - non-space break
U+200E - left to right mark
में अपने पाठ फ़ाइलें क्या एन्कोडिंग है? – unwind