2013-02-12 3 views
11

का उपयोग कर आरटीएफ स्ट्रिंग से एचटीएमएल एचटीएमएल टेक्स्ट को आरटीएफ स्ट्रिंग में कनवर्ट करने का एक तरीका ढूंढ रहा हूं। क्या कोई पुस्तकालय है जो यह काम करता है। मुझे अपनी परियोजना में गतिशील रूप से एचटीएमएल सामग्री मिलती है और इसे आरटीएफ प्रारूप में प्रस्तुत करने की आवश्यकता होती है। मैं HTML पाठ को सामान्य स्ट्रिंग में परिवर्तित करने के लिए HTML पार्सर का उपयोग कर रहा हूं और फिर आरटीएफ प्रारूप में रूपांतरण के लिए पीईआरटीएफ का उपयोग करने का प्रयास कर रहा हूं। क्या कोई बेहतर तरीका है कि यह किया जा सकता है। अग्रिम धन्यवाद।पाइथन

+1

क्या आपने यह देखा है? http://pypi.python.org/pypi/zopyx.convert2 –

उत्तर

0

एक अद्भुत पायथन पुस्तकालय है जो एक टैरबॉल के रूप में आता है।

आप इसे https://pypi.python.org/pypi/zopyx.convert2/2.4.5 पर डाउनलोड कर सकते हैं।

शुभकामनाएं!

+0

केवल तभी उपयोगी है जब आपके पास एक्सएफसी, एक्सआईएनसी, एफओपी, और प्रिंसएक्सएमएल स्थापित करने के इच्छुक हैं या इनमें से तीन वाणिज्यिक सॉफ्टवेयर हैं। –

2

आरटीएफ/से कनवर्ट करने के लिए एक पासा प्रारूप लगता है। मैंने मैक ओएस एक्स पर अनुप्रयोगों के बीच काटने और पेस्ट करने का प्रयास किया है, उदाहरण के लिए, जहां आरटीएफ लिंगुआ फ़्रैंका का कुछ है। उनमें से कुछ ऐप्स माइक्रोसॉफ्ट ऐप हैं (उस आरटीएफ में प्रासंगिक एक माइक्रोसॉफ्ट विकसित प्रारूप है), अन्य नहीं हैं। फ़ॉन्ट आकार, फ़ॉन्ट चेहरे, लाइन स्पेसिंग, और सूची स्टाइल (ऑर्डर या अनॉर्डर्ड) जैसी बुनियादी स्वरूपण जानकारी भी एक स्पष्ट रूप से आरटीएफ-भाषी ऐप से दूसरे में कॉपी करते समय जुड़ी हुई है। सीधे शब्दों में कहें, यह एक गड़बड़ है।

मैंने पाइथन से आरटीएफ को प्रोग्रामेटिक रूप से पढ़ने, लिखने और बदलने के तरीकों की खोज की है। मुझे पीईपीआई पर कई पैकेज मिले, उन्हें बाहर करने का प्रयास निराशाजनक अनुभव रहा है। वे आरटीएफ 1.5 का समर्थन करेंगे, कहते हैं, जब वर्तमान संस्करण 1.9.1 है। आरटीएफ काफी समय से रहा है, लेकिन 2005-पुरानी कल्पना हाल ही में नहीं है। बहुत सारे गॉथ और असंगतताएं थीं। बहुत।

अब, मैं यह नहीं कह रहा कि यह असंभव है, या वहां अन्य पुस्तकालय नहीं हैं जो चाल करेंगे। मेरे पास ने उदाहरण के लिए यहां दूसरों द्वारा उल्लिखित zopyx.convert को आजमाया है। शायद यह बहुत अच्छा है। लेकिन इसकी निर्भरताओं को देखते हुए - जावा, एफओपी, आदि .-- यह एक सुंदर जटिल (और इस प्रकार नाजुक) टूलचेन की तरह दिखता है। मैंने its code on github पढ़ा, और पाइथन वास्तव में केवल एक समन्वय लिबास के रूप में है। यह बाह्य उपकरण एक्सएफसी, एक्सआईएनसी, एफओपी, और प्रिंसएक्सएमएल का आयोजन करता है - जिनमें से चार वाणिज्यिक सॉफ्टवेयर हैं। इसमें प्रमुख एक्सएफसी भाग शामिल है जो आरटीएफ से संबंधित है। मुझे संदेह रंग।

दो कनवर्टर्स जो मुझे मिले हैं वे एक लायक हैं: यदि आप मैक का उपयोग कर रहे हैं, तो textutil कमांड लाइन प्रोग्राम वास्तव में बेहतर और सरल टूल में से एक है जिसे मैंने देखा है।

textutil -convert html filename.rtf -output filename.html 

अन्य प्रारूप इंजन है कि विचार के लायक है LibreOffice है। यह मुफ़्त, खुला स्रोत है, स्वचालन के लिए उचित रूप से उपयुक्त है, और एक इंटरऑपरेबिलिटी हब के रूप में एक सभ्य नींव है। यह सिर्फ एक अनुमान नहीं है; मैंने इसके चारों ओर जटिल, बहु प्रारूप दस्तावेज़ वर्कफ़्लो बनाया है।

मैं सवाल करूंगा कि आप आरटीएफ में क्यों पहुंचने की कोशिश कर रहे हैं। ऐसा लगता है कि आप एक दस्तावेज़ प्रारूप की तरह भागने की कोशिश कर रहे हैं। लेकिन अगर आपको वहां जाना है, तो टेक्स्टुटिल और लिबर ऑफिस कम से कम सबसे खराब तंत्र हैं जिन्हें मैंने पाया है।

+0

अरे जोनाथन, क्या आपको याद है कि आप प्रारूपण करने के लिए लिबर ऑफिस का उपयोग कैसे कर रहे थे? उदाहरण के लिए, विंडोज 7 कमांड लाइन पर मैं निम्न कमांड को आज़माता हूं: "soffice.exe" -हेडलेस-कन्वर्ट-टू आरटीएफ: "रिच टेक्स्ट फॉर्मेट" सी: \ Hello_world.html लेकिन कुछ भी नहीं होता ... – sager89

+0

आमंत्रण मैं (मैकोज़ एक्स पर) का उपयोग करता हूं 'सोफिस --हेडलेस - विज़िविबल - कन्वर्ट-टू आरटीएफ test.html'। मुझे नहीं लगता कि '- विज़िविबल' की आवश्यकता है, बस "कम दिखाई दें" विकल्प। तो समस्या आपको या तो 'आरटीएफ' प्रारूप विनिर्देश' के लिए डबल-हाइफ़न विकल्प उपसर्ग (संभाव्य), और/या आपके ': "रिच टेक्स्ट प्रारूप"' अनुपूरक की आवश्यकता होगी। आज़माएं: 'soffice.exe" --हेडलेस - कन्वर्ट-टू आरटीएफ सी: \ Hello_world.html ' –

+0

विंडोज के लिए, जाहिर है कि आपको केवल एक हाइफ़न का उपयोग करना होगा। मैंने वास्तव में रूट ड्राइव का उपयोग नहीं किया था, बस इस उदाहरण में सादगी के लिए एक छोटा रास्ता चाहता था। इस समस्या को हल करने के लिए मैंने जो किया, वह दृश्य मूलभूत और यहां दिए गए उत्तर का उपयोग किया गया था http://stackoverflow.com/questions/150208/how-do-i-convert-html-to-rtf-rich-text-in- नेट के बिना भुगतान के लिए एक घटक – sager89

0

मुझे लगता है कि यह प्रश्न एक वर्ष से अधिक पुराना है, लेकिन मुझे लगा कि मैं वैसे भी योगदान दूंगा। मुझे हाल ही में एक समान आवश्यकता थी, और PyRTF पर बदल गया, एक छोटा लेकिन शक्तिशाली पायथन मॉड्यूल जो टेक्स्ट फ़ाइल से आरटीएफ दस्तावेजों का निर्माण कर सकता है। आप एचटीएमएल को स्क्रैप करने के लिए Beautiful Soup का उपयोग कर सकते हैं, टैग द्वारा पार्स पेड़ टैग नीचे जा रहे हैं, और उचित ऑब्जेक्ट्स (टेबल, सेल, पैराग्राफ, सेक्शन या दस्तावेज़) बनाने के लिए पीईआरटीएफ एपीआई का उपयोग कर सकते हैं।

एपीआई स्वयं काफी दानेदार है, और कस्टम स्वरूपण (फ़ॉन्ट टेक्स्ट, संरेखण, रंग, शीर्षलेख, पाद लेख इत्यादि) के पूरे समूह की अनुमति देता है।)

उम्मीद है कि इससे मदद मिलती है।