मैं इंटरनेट से डाउनलोड किए गए एचटीएमएल पेज से कुछ लिंक निकालना चाहता हूं, मुझे लगता है कि XML से linq का उपयोग करना मेरे मामले के लिए एक अच्छा समाधान होगा।HTML को XML के रूप में कैसे पढ़ा जाए?
public static string readHTML(string url)
{
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse res = (HttpWebResponse)req.GetResponse();
StreamReader sr = new StreamReader(res.GetResponseStream());
string html = sr.ReadToEnd();
sr.Close();
return html;
}
मुझे लगता है कि लोड करने के लिए प्रयास करते हैं:
मेरे समस्या यह है कि मैं HTML से एक XmlDocument नहीं बना सकते, लोड (स्ट्रिंग यूआरएल) का उपयोग कर तो काम नहीं किया मैं का उपयोग कर एक स्ट्रिंग के लिए एचटीएमएल डाउनलोड किया है LoadXml (स्ट्रिंग xml) का उपयोग करते हुए मैं अपवाद मिल स्ट्रिंग
'--' is an unexpected token. The expected token is '>'
क्या तरह से मैं एक parsable एक्सएमएल के लिए html फ़ाइल को पढ़ने के लिए ले जाना चाहिए
एचटीएमएल जरूरी एक वैध होने की जरूरत नहीं एक्सएमएल। एचटीएमएल एसजीएमएल पर आधारित है, जो स्वयं एक्सएमएल का एक सुपरसेट (प्रकार) है। इसलिए आपको एक विशेष HTML पार्सर की आवश्यकता है, न कि एक सामान्य एक्सएमएल पार्सर। –
नीचे दिए गए उत्तरों में से अधिक और ऊपर टिप्पणी करें। एचटीएमएल एक्सएमएल –