2012-07-06 10 views
7

मैं jsoup उपयोग कर रहा हूँ को साफ़ रखने के लिए jsoup उपयोग करने के लिए और यह वास्तव में कुछ html को साफ़ रखने के लिए अच्छा है, लेकिन मैं निम्नलिखित के रूप में अवैध एचटीएमएल का एक टुकड़ा है:कैसे एचटीएमएल

<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss 

क्या मैं प्राप्त करना चाहते हैं है:

<p>The recurrence, in close succession </p><ul><li>list item 1</li><li>list item 2</li></ul> <p>second part of thisssss</p> 

तो क्या jsoup html को tidying करने और इस आउटपुट को वापस करने में सक्षम है?

धन्यवाद

उत्तर

9

हाँ, यह प्रयास करें:

String html = "<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss"; 
String clean = Jsoup.clean(html, Whitelist.relaxed()); 

साथ ही आप एक और Whitelist उपयोग कर सकते हैं।

+1

ध्यान दें कि JSoup वास्तव में HTML को साफ़ करता है। यह '

    ' जैसे मुद्दों को हल करता है और इसे हल करने के लिए सेट किया जा सकता है। '
    '। – Andrew