संभव डुप्लिकेट:
Java: How to decode HTML character entities in Java like HttpUtility.HtmlDecode?जावा का उपयोग कर एचटीएमएल कोड कैसे डीकोड करें?
मैं पैराग्राफ (जैसे StackOverflow में title
) एक html
फ़ाइल से निकालने की जरूरत है।
मैं आवश्यक फ़ील्ड निकालने के लिए जावा में नियमित अभिव्यक्तियों का उपयोग कर सकता हूं लेकिन मुझे decode
फ़ील्ड प्राप्त हुए हैं।
उदाहरण
क्षेत्र निकाले: डिकोडिंग के बाद
Paging Lucene's search results (with **;** among **'** and **s**)
क्षेत्र:
Paging Lucene's search results
वहाँ जावा में किसी भी वर्ग है कि मुझे इन एचटीएमएल कोड में परिवर्तित करने की अनुमति देगा है?
अपने HTML टैग होते हैं? –
हां, लेकिन निकाले गए फ़ील्ड में टैग – user
स्टार्टर्स के लिए नहीं है, [HTML का विश्लेषण करने के लिए regex का उपयोग करके] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self- निहित टैग) पहली जगह में पूरी तरह से गलत है। जसप की तरह बस एक [एचटीएमएल पार्सर] (http://stackoverflow.com/questions/3152138/what-are-the-pros-and-cons-of-the-leading-java-html-parsers) का उपयोग करें। थोड़ा सभ्य एक आपके लिए तुरंत पहले से ही अनदेखा एचटीएमएल होगा। – BalusC