2016-03-04 6 views
7

मैं एक पैंडोक नौसिखिया हूं, इसलिए मुझे कुछ स्पष्ट याद आना चाहिए। मैं एमएस वर्ड जेनरेट की गई HTML फ़ाइल को मार्कडाउन में कनवर्ट करने की कोशिश कर रहा हूं। यहाँ एक परीक्षण एचटीएमएल है:एचटीएमएल को मार्कडाउन में परिवर्तित करते समय पैंडोक अवधि और div टैग क्यों रखता है?

<html xmlns="http://www.w3.org/1999/xhtml"> 
<head> 
    <title></title> 
</head> 
<body> 
    <div class="Section1"> 
    <p class="Question"><span style="FONT-SIZE: 10pt">Today</span> <span style= 
    "FONT-SIZE: 10pt">is</span> <span lang="HR" style= 
    "FONT-SIZE: 10pt; mso-ansi-language: HR">a</span><span style= 
    "FONT-SIZE: 10pt">nice</span> <span style="FONT-SIZE: 10pt">day</span> 
    </p> 
    </div> 
</body> 
</html> 

और मैं के साथ बदलने की कोशिश:

pandoc -f html -t markdown test.html -o test.md 

मैं उम्मीद कर रहा था "आज एक अच्छा दिन है", लेकिन मिल गया:

<div class="Section1"> 

<span style="FONT-SIZE: 10pt">Today</span> <span 
style="FONT-SIZE: 10pt">is</span> <span lang="HR" 
style="FONT-SIZE: 10pt; mso-ansi-language: HR">a</span><span 
style="FONT-SIZE: 10pt">nice</span> <span 
style="FONT-SIZE: 10pt">day</span> 

</div> 

Div क्यों रखा गया था? स्पैन क्यों रखा गया था?

उत्तर

12

आपको कुछ extensions बंद करना होगा। या तो HTML इनपुट की ओर:

$ pandoc -f html-native_divs-native_spans -t markdown test.html -o test.md 

या markdown उत्पादन पक्ष पर:

$ pandoc -f html -t markdown-raw_html-native_divs-native_spans-fenced_divs test.html -o test.md 
संबंधित मुद्दे