मैंने एक पूरे वेबपृष्ठ के एचटीएमएल को एक स्ट्रिंग में सहेजा है, और अब मैं लिंक से "href" मान को पकड़ना चाहता हूं, अधिमानतः बाद में उन्हें अलग-अलग तारों में सहेजने की क्षमता के साथ। ऐसा करने का सबसे अच्छा तरीका क्या है?सी # - वेब पेज पार्स करने के लिए सर्वश्रेष्ठ दृष्टिकोण?
मैंने स्ट्रिंग को एक .xml दस्तावेज़ के रूप में सहेजने और XPathDocument नेविगेटर का उपयोग करके इसे पार्स करने का प्रयास किया है, लेकिन (आश्चर्य की बात है) यह वास्तव में एक-वास्तव में-XML-दस्तावेज़ को नेविगेट नहीं करता है।
नियमित रूप से अभिव्यक्तियों को प्राप्त करने के लिए सर्वोत्तम तरीका है जो मैं पूरा करने की कोशिश कर रहा हूं?
अच्छा जवाब - regex अपने दोस्त है! –
खराब जवाब। ऐसा मत करो। – SLaks
-1 हम्म, HTML का विश्लेषण करने के लिए Regex का उपयोग कर। क्या गलत होने की सम्भावना है? ओह यह सही है: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Ash