मैं निम्नलिखित तरीके से HTML स्रोत प्राप्त करने की कोशिश हो रही है:सी # में WebBrowser नियंत्रण के माध्यम से HTML स्रोत
webBrowser1.Document.Body.OuterHtml;
लेकिन यह काम नहीं करता। उदाहरण के लिए, यदि मूल HTML स्रोत है:
<html>
<body>
<div>
<ul>
<li>
<h3>
Manufacturer</h3>
</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_3808675_100021_10194772_">Sony </a>(44)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_108496_100021_10194772_">Nikon </a>(19)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_3808726_100021_10194772_">Panasonic </a>(37)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_3808769_100021_10194772_">Canon </a>(29)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_2913388_100021_10194772_">Olympus </a>(21)</li>
<li class="seeAll"><a href="/4566-6501_7-0.html?
sa=1000036&filter=100021_10194772_" class="readMore">See all manufacturers </a></li>
</ul>
</div>
</body>
</html>
लेकिन webBrowser1.Document.Body.OuterHtml
के उत्पादन में है:
<body>
<div>
<ul>
<li>
<h3>
Manufacturer</h3>
<li><a href="/4566-6501_7-0.html?filter=1000036_3808675_100021_10194772_">Sony </a>(44)
<li><a href="/4566-6501_7-0.html?filter=1000036_108496_100021_10194772_">Nikon </a>(19)
<li><a href="/4566-6501_7-0.html?filter=1000036_3808726_100021_10194772_">Panasonic
</a>(37)
<li><a href="/4566-6501_7-0.html?filter=1000036_3808769_100021_10194772_">Canon </a>
(29)
<li><a href="/4566-6501_7-0.html?filter=1000036_2913388_100021_10194772_">Olympus </a>
(21)
<li class="seeAll"><a class="readMore" href="/4566-6501_7-0.html?sa=1000036&filter=100021_10194772_">
See all manufacturers </a></li>
</ul>
</div>
</body>
के रूप में आप देख सकते हैं, कई </li>
खो जाते हैं।
WebBrower
में एचटीएमएल स्रोत प्राप्त करने का कोई तरीका सही तरीके से नियंत्रण है? ध्यान दें कि मेरे आवेदन में, मैं प्रत्येक नोड में समन्वय जानकारी जोड़ने के लिए WebBrowser
का उपयोग करने का प्रयास करता हूं और इसके एचटीएमएल स्रोत को समन्वय जानकारी के साथ आउटपुट करता हूं जिसे नोड्स के गुणों के रूप में जोड़ा जाता है।
कोई मुझे एक पक्ष कर सकता है?
हां, दस्तावेज़ टेक्स्ट और दस्तावेज़स्ट्रीम दोनों सही HTML स्रोत लौटा सकते हैं। लेकिन जब मैं डोम ट्री (myIHTMLElement.setAttribute()) में नोड्स में कुछ विशेषताओं को जोड़ता हूं, तो HTML स्रोत WebBrowser1 द्वारा प्राप्त होता है। डॉक्यूमेंटटेक्स्ट में कोई भी अतिरिक्त विशेषता नहीं है – Rockycqu
@Rockucqu, 'InnerHtml' प्रॉपर्टी के बारे में क्या - क्या यह सही HTML लौटाता है? – VinayC