के साथ एचटीएमएल पार्सिंग मैं SAX पार्सर का उपयोग कर सामान्य HTML फ़ाइल को पार्स करने का प्रयास कर रहा हूं।SAX पार्सर
SAXBuilder builder2 = new SAXBuilder();
try {
Document sdoc = (Document)builder2.build(readFile);
NodeList nl=sdoc.getElementsByTagName("body");
System.out.println("nodelist>>>>>>>>>>>"+nl.getLength());
} catch (JDOMException e1) {
e1.printStackTrace();
}
लेकिन मैं अपवाद
Open quote is expected for attribute "{1}" associated with an element type "class".
किसी को भी मुझे बता सकते हैं क्यों मैं इस अपवाद हो रही हो रही है, एचटीएमएल दस्तावेज़ में अच्छी तरह से बनाई है और यह सब खुले और बंद टैग ठीक है।
अग्रिम धन्यवाद।
क्या कोई विशिष्ट कारण है कि आप SAX के साथ ऐसा क्यों करना चाहते हैं? – flash
नहीं, बस शरीर की सामग्री को HTML फ़ाइल से प्राप्त करना चाहते हैं, इसलिए, मैंने इसका इस्तेमाल किया। क्या कोई अन्य समाधान है? – user972590
SAX के साथ आप एक्सएचटीएमएल का विश्लेषण कर सकते हैं, लेकिन मुझे यकीन नहीं है कि यह HTML को भी पार्स कर सकता है (कम से कम अधिकांश एक्सएमएल पार्सर नहीं)। एचटीएमएल एक अच्छी तरह से गठित एक्सएमएल होना जरूरी नहीं है। –