2008-09-23 9 views
5

मुझे आशा है कि यह प्रोग्रामर से संबंधित प्रश्न है। मैं सी # प्रोग्रामिंग के शौक व्यवसाय में हूं। अपने उद्देश्यों के लिए मुझे एचटीएमएल फाइलों को पार्स करने की ज़रूरत है और सबसे अच्छा विचार है ... नियमित अभिव्यक्ति। जैसा कि कई लोगों ने पाया, उन्हें सीखने में काफी समय लगता है और इस प्रकार मुझे बहुत दिलचस्पी है यदि आप कुछ एप्लिकेशन के बारे में जानते हैं जो इनपुट (किसी भी कोड का टुकड़ा) लेने में सक्षम होंगे, समझें कि मुझे (मेरे द्वारा मुझे "कट आउट" करने के लिए आवश्यक कोड का एक टुकड़ा चुनना), और मुझे इसके लिए या अधिक विकल्पों के लिए उचित नियमित अभिव्यक्ति दें।क्या वांछित क्षेत्र का चयन करके टेक्स्ट से नियमित अभिव्यक्ति बनाने के लिए कोई आवेदन है?

जैसा कि मैंने सुना है, रेगेक्स स्वयं का एक छोटा सा विज्ञान है, इसलिए यह कल्पना करना उतना आसान नहीं होगा जितना मैं कल्पना करूंगा।

उत्तर

8

हाँ वहाँ रॉय Osherove लिखा आप के लिए क्या चाहिए, तो है - regulazy

+0

हाँ धन्यवाद, एप्लिकेशन अच्छा है, मुझे बस सीखना है कि इसके साथ कैसे काम करना है :) – Skuta

2

आपके प्रश्न का वास्तविक उत्तर नहीं है, क्योंकि इसका रेगेक्स के साथ कुछ लेना देना नहीं है, लेकिन HtmlAgilityPack आपकी पार्सिंग में आपकी सहायता कर सकता है।

2

तुम भी txt2re करके देख सकते हैं: http://txt2re.com/ है, जो एक उपयोगकर्ता के आपूर्ति की स्ट्रिंग में पैटर्न की पहचान करने की कोशिश करता है और एक regex बनाने की अनुमति देता उनमे से।

1

मुझे इस पर सनी से सहमत होना चाहिए: यदि आप एचटीएमएल को पार्स कर रहे हैं, तो आप इसे एक्सएमएल में परिवर्तित कर सकते हैं (एचटीएमएल एजिलिटी पैक का उपयोग करके यह आसानी से आसान है) और फिर आप नियमित अभिव्यक्तियों के बजाय XPATH अभिव्यक्तियों का उपयोग कर सकते हैं , यह नौकरी के लिए काफी बेहतर है।

संबंधित मुद्दे