पर विचार लगता है:अजगर - - Regex कैसे तार के दो सेट के बीच एक स्ट्रिंग निम्नलिखित
<div id=hotlinklist>
<a href="foo1.com">Foo1</a>
<div id=hotlink>
<a href="/">Home</a>
</div>
<div id=hotlink>
<a href="/extract">Extract</a>
</div>
<div id=hotlink>
<a href="/sitemap">Sitemap</a>
</div>
</div>
कैसे आप अजगर में regex के साथ साइटमैप लाइन बाहर लेने के बारे में जाना होगा?
<a href="/sitemap">Sitemap</a>
एंकर टैग खींचने के लिए निम्नलिखित का उपयोग किया जा सकता है।
'/<a(.*?)a>/i'
हालांकि, कई एंकर टैग हैं। इसके अलावा कई हॉटलिंक भी हैं इसलिए हम वास्तव में उनका उपयोग नहीं कर सकते हैं?
आप शायद सुनेंगे कि नियमित अभिव्यक्ति उपयुक्त नहीं हैं एक विषय से मुक्त पार्स करने के लिए एचटीएमएल की तरह भाषा। – Gumbo
यदि आप उस HTML को उत्पन्न कर रहे हैं, तो यह ध्यान देने योग्य है कि एकाधिक, समान 'id = 'विशेषताएं मान्य नहीं हैं। एक 'वर्ग =' अधिक उपयुक्त है। –