2009-05-06 14 views
14

हटाएं मेरे पास कुछ .tex फ़ाइलें हैं जिनमें से मैं किसी भी लेटेक्स टैग जैसे \ section {...} या \ newpage के बिना सादे पाठ प्राप्त करना चाहता हूं।
क्या किसी को यह हासिल करने के बारे में कोई विचार है? मेरे पास .pdf फ़ाइल भी है, लेकिन जब मैं वहां से कोड कॉपी करता हूं, तो कुछ शब्द संगत हो जाते हैं जो वास्तविक खराब है।
क्या आपके पास कोई उपकरण है?टेक्स्ट से टेक्स्ट निकालें, लेटेक्स टैग

उत्तर

19

detex(1):

कृपया OpenDetex के नवीनतम संस्करण के लिए OpenDetex GitHub page देखते हैं। यह मेरे मूल डीटेक्स का एक आधुनिक, व्युत्पन्न संस्करण है।

मेरी विरासत DeTeX home pagehere उपलब्ध है।

यदि आप सिर्फ विरासत detex-2.8.tar स्रोत चाहते हैं, तो आप इसे here प्राप्त कर सकते हैं।

+0

आपका स्वागत है के माध्यम से

नेविगेट project.tex

है! –

+4

केवल ASCII टेक्सास फ़ाइलों पर काम करता है। यदि आप गैर-ASCII वर्णों के साथ xelatex और UTF-8 एन्कोडेड टेक्स्ट फ़ाइलों का उपयोग कर रहे हैं, तो गैर-ASCII वर्णों के लिए डिटेक्स आउटपुट जंक। – Lucas

+1

यह खुला स्रोत है, इसे हमेशा तय किया जा सकता है। –

6

opendetex खिड़कियों के लिए दोनों में उपलब्ध है और लिनक्स

डाउनलोड यहाँ से कार्यक्रम opendetex
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list

उपयोग: http://code.google.com/p/opendetex/wiki/Usage

अपनी पसंद के किसी डायरेक्टरी में निकालने । कहें कि आप इसे डाउनलोड निर्देशिका में निकालें।

उसमें किसी भी नाम की एक और निर्देशिका बनाएं (वैकल्पिक। लेकिन अगर आप इसे बनाते हैं तो यह अच्छा है)। कहें निर्देशिका नाम "my_paper" है। अपने पेपर को "my_paper" निर्देशिका में रखें। कहते हैं कि अपने कागज नाम पथ

cd ~/Downloads/opendetex 

भागो आदेश

detex -n my_paper/project.tex > out.txt 

सामान्य रूप

detex -n full_path_to_tex_file.tex > output_text_file.txt 
संबंधित मुद्दे