मैं विभिन्न पृष्ठों के लिए HTML उत्पन्न करने के लिए HtmlUnit का उपयोग कर रहा हूं, लेकिन अभी, सबसे अच्छा मैं पृष्ठ को कच्चे HTML में प्राप्त करने के लिए कर सकता हूं जो सर्वर लौटाता है HTML HTML को XML स्ट्रिंग में परिवर्तित करना है।HtmlUnit - एचटीएमएल पेज को एचटीएमएल स्ट्रिंग में कनवर्ट करें?
यह कुछ हद तक परेशान है क्योंकि एक्सएमएल आउटपुट कच्चे HTML की तुलना में अलग-अलग वेब ब्राउज़र द्वारा प्रदान किया जाता है। क्या XML के बजाय XML HTML को कच्चे HTML में परिवर्तित करने का कोई तरीका है?
धन्यवाद!
getWebResponse() स्क्रिप्ट द्वारा किए गए संशोधनों के बिना मूल पृष्ठ देता है। तो asxml() और asText() अंतिम पृष्ठ प्राप्त करने के लिए एक बेहतर समाधान है। – snorbi