मुझे एक रेगेक्स चाहिए जो एक HTML स्रोत पृष्ठ में सशर्त टिप्पणियों से मेल खा सकता है, इसलिए मैं केवल उन्हीं को हटा सकता हूं। मैं नियमित टिप्पणियों को संरक्षित करना चाहता हूं।सशर्त टिप्पणियों को हटाने के लिए Regex
मैं भी * * का उपयोग करने से बचना चाहूंगा। यदि संभव हो तो नोटेशन।
पाठ
foo
<!--[if IE]>
<style type="text/css">
ul.menu ul li{
font-size: 10px;
font-weight:normal;
padding-top:0px;
}
</style>
<![endif]-->
bar
है और मैं में <!--[if IE]>
और <![endif]-->
संपादित सब कुछ निकालना चाहते हैं: यह इसलिए क्योंकि BeautifulSoup की मैं इन टैग निकालना चाहते हैं। सुंदर सूप पार्स करने में विफल रहता है और एक अधूरा स्रोत देता है
EDIT2: [यदि आईई] एकमात्र शर्त नहीं है। बहुत कुछ हैं और मेरे पास सभी संभावित संयोजनों की कोई सूची नहीं है।
EDIT3: विंको वर्सालोविक का समाधान काम करता है, लेकिन सशर्त टिप्पणी के भीतर एक दुष्ट टिप्पणी के कारण सुंदर समस्या क्यों विफल हुई थी। जैसा
<!--[if lt IE 7.]>
<script defer type="text/javascript" src="pngfix_253168.js"></script><!--png fix for IE-->
<![endif]-->
सूचना <!--png fix for IE-->
टिप्पणी?
हालांकि मेरी समस्या हल हो गई थी, मुझे इसके लिए रेगेक्स समाधान प्राप्त करना अच्छा लगेगा।
बिना। *? कोई भी नहीं है, खासकर यदि आप सभी संभावित संयोजनों को नहीं जानते हैं, तो आप उन्हें बिना किसी * के समान कैसे पकड़ेंगे? और एक से अधिक सशर्त टिप्पणी होने पर गैर-लालची संशोधक की आवश्यकता है ... –
@ विंको वर्सालोविक: आप रोकने के लिए एक लुकहेड मिलान कर सकते हैं। *? उपयोग: http://www.regular-expressions.info/lookaround.html – Huppie
आप गैर लालची से क्यों बचना चाहते हैं। *? निर्माण? –