मुझे HTML डेटा का एक गुच्छा मिला है जिसे मैं PHP का उपयोग करके पीडीएफ फ़ाइल में लिख रहा हूं। पीडीएफ में, मैं चाहता हूं कि सभी एचटीएमएल को छीन लिया जाए और साफ़ किया जाए। तो उदाहरण के लिए:स्वच्छ स्ट्रिंग बनाने के लिए PHP के साथ क्लीनअप एचटीएमएल
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
बन चाहिए:
First list item
Second list item which is quite a bit longer
List item with apostrophe 's 's
हालांकि, अगर मैं बस strip_tags()
उपयोग करते हैं, मैं कुछ इस तरह मिलती है:
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
इसके अलावा उत्पादन का खरोज ध्यान दें।
एचटीएमएल को अच्छी तरह से साफ करने के तरीके के बारे में कोई सुझाव, गंदे सफेद जगहों और अजीब पात्रों के बिना साफ, साफ तारों को कैसे साफ करें?
धन्यवाद :)
मुझे संदेह है कि 'strip_tags()' अकेले आपकी इकाइयों को एन्कोड करेगा। क्या आप वाकई कहीं 'htmlentities' पर कॉल नहीं खो रहे हैं? – Yoshi
इंडेंटिंग बिल्कुल वही है जो मैं उम्मीद करता हूं, PHP टैग को अलग कर रहा है, लेकिन उनके चारों ओर अतिरिक्त पाठ नहीं है। – scragar
क्या आपका मतलब है कि मुझे * चाहिए * * * * कहीं भी htmlentities() का उपयोग नहीं करना चाहिए? इस समय मैं नहीं हूँ। एचटीएमएल डेटा सीधे डेटाबेस से आता है। – Rein