मैं एक वेब पेज को पार्स करना चाहता हूं, कुछ पदों पर एंकर डालना चाहता हूं और Dash के लिए डॉक्ससेट जेनरेट करने के लिए संशोधित डीओएम को दोबारा प्रस्तुत करना चाहता हूं। क्या यह संभव है?मैं html5ever के साथ किसी पृष्ठ को कैसे पार्स कर सकता हूं, डीओएम संशोधित कर सकता हूं, और इसे क्रमबद्ध कर सकता हूं?
html5ever में शामिल उदाहरणों से, मैं देख सकता हूं कि एक HTML फ़ाइल कैसे पढ़ा जाए और एक गरीब व्यक्ति के HTML आउटपुट को कैसे करें, लेकिन मुझे समझ में नहीं आता कि मैं RcDom
ऑब्जेक्ट को पुनर्प्राप्त कैसे कर सकता हूं।
मैं RcDom
पर एक एंकर तत्व (<a name="foo"></a>
) डालने वाला एक स्निपेट देखना चाहता हूं।
नोट: यह जंग और एचटीएमएल 5 विशेष रूप से संबंधित प्रश्न है ... मुझे पता है कि इसे अन्य भाषाओं या सरल HTML पार्सर्स में कैसे करना है।
बहुत बहुत धन्यवाद, बिल्कुल वही जो मैं उम्मीद कर रहा था। – kesselborn
1 साल पुराना उत्तर, लेकिन मैंने आज इस कोड को आजमाया है और यह मेरे लिए संकलित करने में विफल रहता है। मैं जंग 1.20.0 पर हूं और html5ever के नवीनतम संस्करण का उपयोग कर रहा हूं। त्रुटि 'अनसुलझा आयात html5ever :: rcdom :: NodeEnum :: Element' है और यह कहता है कि इसे अब NodeEnum नहीं मिला है। क्या इसे बहिष्कृत किया गया था? क्या मैं कुछ भुल गया ? – ghlecl