Regex HTML फ़ाइलों को पार्स करने के लिए एक अच्छा विकल्प नहीं है ..
एचटीएमएल सख्त नहीं है और न ही वह अपने स्वरूप के साथ नियमित रूप से है ..
उपयोग htmlagilitypack
का उपयोग क्यों करें पार्सर?
पर विचार करें अपने regex..There मामलों में जहां आप अपने कोड को तोड़ सकते थे की अनंत संख्या रहे हैं
- अगर वहाँ नेस्टेड divs
- कुछ divs न एक समाप्त होने टैग है! (सिवाय हैं आपका रेगुलर एक्सप्रेशन से काम नहीं करेगा एक्सएचटीएमएल)
आप इस कोड का उपयोग कर सकते हैं का उपयोग कर इसे पुनः प्राप्त करने HtmlAgilityPack
HtmlDocument doc = new HtmlDocument();
doc.Load(yourStream);
var itemList = doc.DocumentNode.SelectNodes("//div[@id='thumbs']")//this xpath selects all div with thubs id
.Select(p => p.InnerText)
.ToList();
//itemList now contain all the div tags content having its id as thumbs
लेकिन पर * टिप्पणी प्यार एचटीएमएल चपलता पैक – Sayse