के साथ पायथन में एक्सएमएल पार्सिंग मैं XML
फ़ाइल को पार्स करने के लिए रेगेक्स का उपयोग करने की कोशिश कर रहा हूं (मेरे मामले में यह सबसे आसान तरीका लगता है)।रीजिक्स
उदाहरण के लिए एक लाइन हो सकता है:
line='<City_State>PLAINSBORO, NJ 08536-1906</City_State>'
टैग City_State के लिए पाठ का उपयोग करने के लिए, मैं उपयोग कर रहा हूँ:
attr = re.match('>.*<', line)
लेकिन कुछ नहीं लौटे जा रहा है।
कोई बता सकता है कि मैं क्या गलत कर रहा हूं?
की तरह एक XML पार्सर का उपयोग मैं लिंक करने के लिए मजबूर हूँ [इस उत्तर] (http://stackoverflow.com/a/1732454/78845)। – Johnsyweb
एक उचित XML लाइब्रेरी का उपयोग करना मुश्किल नहीं है जब आपको अपनी पसंद की लाइब्रेरी मिल जाए। मैंने पाया [ElementTree] (http://docs.python.org/2/library/xml.etree.elementtree.html) मानक लाइब्रेरी में से किसी एक का उपयोग करने के लिए सबसे अच्छा, और [untangle] (https://github.com/stchris/untangle) सबसे आसान (यह एक्सएमएल को नियमित शब्दकोशों/सूचियों आदि में परिवर्तित करता है) – dbr
डांग, @ जॉन्सवेव ने मुझे इसे हराया! – torek