2012-07-09 11 views
5

का उपयोग कर निकालें एमएस वर्ड "एचटीएमएल":
What is the best free way to clean up Word HTML?
PHP to clean-up pasted Microsoft inputसंभव डुप्लिकेट पीएचपी

मैं ग्राहकों को एक अमीर पाठ संपादक में नोटों प्रवेश करने की अनुमति, और हाल ही में अपग्रेड किया है ckEditor 3x, जो डिफ़ॉल्ट रूप से एमएस शब्द वर्ग, शैलियों और टिप्पणियों को स्ट्रिप करता है (जब उपयोगकर्ता संपादक ऑब्जेक्ट में पेस्ट करते हैं)। तो आगे बढ़ना मैं पूरी तरह से तैयार हूँ।

मुझे हाल ही में 5 साल के नोट्स को साफ करने की आवश्यकता है जिनमें से कुछ में एमएस शब्द एचटीएमएल एम्बेडेड है। मुझे पाठ के इस शरीर के माध्यम से लूप करने की जरूरत है और इसे साफ करें।

मुझे सभी अवधि टैग को बाहर करने की आवश्यकता नहीं है, केवल माइक्रोसॉफ्ट द्वारा लिखी गई पहचान की गई है।

मैंने HTMLCleaner का उपयोग करने का प्रयास किया है, लेकिन यह एमएस जेनरेट किए गए HTML को नहीं हटा रहा है। http://word2cleanhtml.com वही करता है जो मैं चाहता हूं, हालांकि डेवलपर्स वर्तमान में सार्वजनिक उपयोग के लिए एपीआई नहीं दे रहे हैं (9 जुलाई, 2012 तक)।

मैंने पिछले कुछ हफ्तों के लिए इस तरह के एक वर्ग की तलाश की है और मुझे बहुत भाग्य नहीं है। क्या आप में से कोई भी एक उपयोगी वर्ग है जिसे आप साझा करना चाहते हैं?

+0

स्पष्टीकरण के लिए, मुझे एक सर्वर-साइड क्लास की आवश्यकता है जिसे मैं अपने मौजूदा एप्लिकेशन में एम्बेड कर सकता हूं। मारियो द्वारा संदर्भित SO प्रश्न/उत्तर में कुछ महान उपकरण हैं, हालांकि मुझे लगता है कि वे अधिकांश भाग के लिए एक-शॉट रूपांतरण के लिए डिज़ाइन किए गए हैं - या अपनी वेबसाइट पर पोस्ट करने के लिए कर्ल का उपयोग कर रहे हैं। पीएचआई के साथ ऐसा नहीं कर सकता। –

+0

मारियो, आपके यूआरएल कहां गए हैं? वे उपयोगी थे, और बंद करने के लिए मेरे औचित्य का हिस्सा थे। वे एक पूर्वदर्शी लिपि का उपयोग कर एचटीएमएल क्लीनअप करने के लिए ओपी के लिए भी उपयोगी होना चाहिए। – halfer

+0

मुझे आशा है कि यह प्रश्न उपलब्ध रहेगा, क्योंकि मैक्सहुड का उत्तर नीचे दिए गए प्रश्न को मेरे प्रश्न को टी। एचटीएमएलपाइफायर एक वर्ग है, न कि वेबसाइट जो उपयोगकर्ता ब्राउज़ और अपलोड करते हैं। –

उत्तर

संबंधित मुद्दे