2010-11-19 15 views
9

मैं पीसा का उपयोग कर रहा हूं, जो पाइथन के लिए पीडीएफ रूपांतरण पुस्तकालय के लिए एक HTML है।पाइथन में .doc कनवर्टर से एचटीएमएल?

क्या वर्ड दस्तावेज़ के लिए एक ही चीज़ मौजूद है: एक HTML से .doc रूपांतरण लाइब्रेरी पाइथन के लिए?

+0

के बजाय क्यों आप इस चाहेगा? एमएस वर्ड एचटीएमएल पढ़ सकते हैं। – MSalters

+0

मुझे एक ही समस्या है: मेरे पास एक HTML है जो पीडीएफ में कनवर्ट करने के लिए पीसा का उपयोग करता है और मैं वही चीज़ शब्द के साथ करना चाहता हूं। इसका एक बड़ा दस्तावेज़, ~ 20 पृष्ठ, एचटीएमएल उत्पन्न करने के लिए कोड के एक ही टुकड़े का उपयोग करके और फिर पीसा या कुछ और के माध्यम से निर्यात करना बहुत अच्छा होगा। –

+0

@Eric: हाल ही में, मुझे एक ही समस्या थी। बस सोच रहा था, क्या आपको HTML को Word .docx में कनवर्ट करने का समाधान मिला? धन्यवाद। –

उत्तर

3

हालांकि मैं एक सीधा मॉड्यूल है कि आप इस कन्वर्ट करने के लिए अनुमति दे सकते हैं के बारे में पता नहीं कर रहा हूँ, हालांकि:

  1. आप एचटीएमएलमें सादे पाठ पहले html2text मॉड्यूल का उपयोग कर बदल सकते हैं।
  2. उसके बाद, आप एक डॉक या एक docx फाइल करने के लिए पाठ परिवर्तित करने के लिए इस python-docx मॉड्यूल का उपयोग कर सकते हैं।
9

आप एमएस वर्ड को आपके लिए परिवर्तित करने के लिए विंडोज़ के लिए pywin32 पायथन एक्सटेंशन से Win32com का उपयोग कर सकते हैं। एक साधारण उदाहरण:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit() 
2

मामले किसी और भूमि यहाँ दूसरी तरह के आसपास परिवर्तित करने के लिए प्रयास कर रहा में, ऊपर कोड काम करता है, लेकिन आप fileformat मूल्य को संशोधित करने की जरूरत है।

http://msdn.microsoft.com/en-us/library/ff839952.aspx

उदाहरण: छानने का एचटीएमएल 10 है, 0.

संबंधित मुद्दे