मैं कुछ अच्छी तरह से गठित एक्सएमएल को डीओएम में पार्स करना चाहता हूं, लेकिन मैं मूल मीडिया में प्रत्येक नोड के टैग का ऑफसेट जानना चाहता हूं।जावा एक्सएमएल पार्सिंग और मूल बाइट ऑफ़सेट
उदाहरण के लिए, अगर मैं की तरह सामग्री कुछ के साथ एक XML दस्तावेज था:
<html>
<body>
<div>text</div>
</body>
</html>
मुझे पता है कि नोड शुरू होता है पर मूल मीडिया में 13 ऑफसेट, और (अधिक महत्वपूर्ण) करना चाहते हैं कि "टेक्स्ट" ऑफसेट पर शुरू होता है 18.
क्या यह मानक जावा एक्सएमएल पार्सर्स के साथ संभव है? JAXB? यदि कोई समाधान आसानी से उपलब्ध नहीं है, तो इसे संभव बनाने के लिए पार्सिंग पथ के साथ किस प्रकार के बदलाव आवश्यक हैं?
बड़े एक्सएमएल फाइल और कैसे JAXB के साथ उपयोग करने के लिए चरित्र ऑफसेट खोजने के लिए इस सवाल http://stackoverflow.com/questions/43366566 पर एक नजर डालें। – jschnasse