मेरे पास एक वेबसाइट अपडेटर है (लोग सामग्री (टेक्स्ट) को वेबसाइट के रूप में अपडेट नहीं कर सकते हैं) जिसमें एचटीएमएल, जावास्क्रिप्ट फ्रंट एंड लैंग्वेज & पाइथन बैक एंड/सर्वर पक्ष के रूप में है।एचटीएमएल पार्सिंग के लिए सर्वश्रेष्ठ पायथन मॉड्यूल
मैं लग रहा है कि HTML को अद्यतन करने के सामने के छोर से बहुत मुश्किल है क्योंकि जब मैं ele.innerHTML या $ (हाथी) .html() ब्राउज़र के आधार पर बदल एचटीएमएल देता है (के द्वारा अद्यतन एचटीएमएल हड़पने लानत अर्थात)।
तो मैं अजगर
आपको क्या लगता एचटीएमएल & हड़पने जानकारी पार्स करने के लिए सबसे अच्छा अजगर मॉड्यूल है में, बैकएंड, यानी से मेरी एचटीएमएल अद्यतन करने के लिए फैसला किया है?
मेरे आवश्यकताएँ हैं:
- मैं HTML & सभी HTML तत्वों उस वर्ग के हैं खोजने पार्स करने दिया जाएगा "updatable"
- कि मॉड्यूल अजगर 2.5 या उससे कम (मेरे webhost की वजह से) में
कम से कम हो - "अद्यतन करने योग्य" वर्ग के प्रत्येक तत्व के लिए: आंतरिक टेक्स्ट निकालें (HTML केवल टेक्स्ट/सामग्री नहीं)
आप किस पायथन मॉड्यूल का सुझाव देंगे इसके लिए सबसे अच्छा है?
- HTMLParser.py
- htmllib.py
- किसी अन्य पायथन 2.5 संगत मॉड्यूल के बारे में पता है?
सुंदर सूप अब 3 जुलाई 2012 से रिलीज के साथ फिर से सक्रिय प्रतीत होता है। Http://www.crummy.com/software/BeautifulSoup/ – jforberg
दरअसल, यह अच्छी खबर है! – David