मैं गैर-लालची से टीडी टैग को पार्स करने का प्रयास कर रहा हूं।रेगेक्स गैर-लालची
<TD>stuff<TD align="right">More stuff<TD align="right>Other stuff<TD>things<TD>more things
मैं नीचे का उपयोग कर रहा मेरी regex के रूप में: मैं कुछ इस तरह के साथ शुरू कर रहा हूँ
Regex.Split(tempS, @"\<TD[.\s]*?\>");
रिकॉर्ड के रूप में नीचे लौट:
""
"stuff<TD align="right">More stuff<TD align="right>Other stuff"
"things"
"more things"
क्यों यह नहीं है विभाजन जो पहले पूर्ण परिणाम ("सामान" से शुरू होता है)? पैरामीटर के साथ या बिना टीडी टैग के सभी उदाहरणों पर विभाजित करने के लिए मैं रेगेक्स को कैसे समायोजित कर सकता हूं?
कृपया देखें http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –
'.' सिर्फ चरित्र वर्ग '[।]', 'किसी भी चरित्र' में एक शाब्दिक बिंदु का मतलब है। आप _may_ को '[^>] * 'के साथ और अधिक सफलता मिली है, _but_ यह एक विशेषता में'> 'पर टूट जाएगा (जो कारणों में से एक है कि हम अक्सर पार्सर्स को क्यों देखते हैं बल्कि HTML और xml में हेरफेर करने के लिए regexes)। – Wrikken
@Wrikken यहां HTML बहुत स्थिर है। इसमें बहुत भिन्नता नहीं है और मुझे रेगेक्स पता है जो इसके लिए काम करेगा। मैं इसके कारण पार्सर्स का मार्ग नहीं गया था। क्या बनाने का कोई तरीका है। चरित्र का अर्थ है 'किसी भी चरित्र' जिसमें व्हाइटस्पेस शामिल है? – steventnorris