का उपयोग कर टेक्स्ट फ़ाइल में अदृश्य वर्णों को कैसे ढूंढें और हटाएं मेरे पास कॉपीिंग नामक एक txt फ़ाइल है जिसे विंडोज़ पर संपादित किया गया है। इसमें विंडोज स्टाइल ईओएलemacs
$ file COPYING
COPYING: ASCII English text, with CRLF line terminators
मैंने इसे dos2unix का उपयोग करके यूनिक्स शैली में बदलने की कोशिश की। नीचे दिए गए आउटपुट
$ dos2unix COPYING
dos2unix: Skipping binary file COPYING
मुझे लगता है कि dos2unix कार्यक्रम आश्चर्य हुआ एक बाइनरी फ़ाइल के रूप में यह रिपोर्ट है। फिर कुछ अन्य संपादक (emacs नहीं) का उपयोग करके मैंने पाया कि फ़ाइल में एक नियंत्रण चरित्र है। मुझे emacs का उपयोग कर फ़ाइल में सभी अदृश्य वर्णों को खोजने में दिलचस्पी है।
मैं निम्नलिखित समाधान जो टीआर
tr -cd '\11\12\40-\176' < file_name
Emacs तरह से भी ऐसा ही करने के लिए उपयोग करता पाया है googling द्वारा। मैंने हेक्सल-मोड की कोशिश की। हेक्सल-मोड एक एकल बफर में टेक्स्ट और उनके संबंधित एसीआईआई मान दिखाता है जो बहुत अच्छा है। 11-12, 40-176 (यानी टैब, स्थान और दृश्यमान वर्ण) के अलावा ASCII मान वाले वर्णों को कैसे खोजें। मैंने उस खोज के लिए नियमित अभिव्यक्ति बनाने की कोशिश की, लेकिन यह काफी जटिल है।
उत्तर के लिए धन्यवाद। मैं समझना चाहता था कि नियमित अभिव्यक्ति क्या करती है। मैंने "वर्णन-चरित्र-सेट" आदेश टाइप किया, फिर चरित्र सेट देखने के लिए "ascii" चुना। क्या आप कृपया बता सकते हैं कि आपने सी-जे को क्यों याद किया और सी- दस्तावेज है –
@Talespin_Kit 'C-i' टैब है, 'सी-जे' नई लाइन है। – Gilles
यह लिंक http://www2.lib.uchicago.edu/keith/tcl-course/emacs-tutorial.html कहता है सी-एम आरईटी कुंजी के लिए है। मैं उस दस्तावेज़ को खोजने में सक्षम नहीं हूं जहां सी-? दस्तावेज है क्या आप इसे इंगित कर सकते हैं। –