मैं एक HTML पृष्ठ लेना चाहता हूं और बस उस पृष्ठ पर शुद्ध पाठ निकालने के लिए देख रहा हूँ। किसी को भी अजगर में ऐसा करने का एक अच्छा तरीका पता है?सब कुछ तोड़ने का सर्वोत्तम तरीका लेकिन वेबपृष्ठ से टेक्स्ट?
मैं सचमुच सबकुछ बाहर करना चाहता हूं और केवल लेखों के पाठ के साथ रहना चाहता हूं और टैग के बीच कभी भी अन्य पाठ क्या है। जेएस, सीएसएस, आदि ...
धन्यवाद!
भेड़ियों वाला हैं इस एक के लिए आप मिलता है। – jathanism
हाँ, आम तौर पर मैं एचटीएमएल को पार्स करने के लिए नियमित अभिव्यक्तियों के उपयोग के खिलाफ हूं, लेकिन यह एक साधारण पर्याप्त दृष्टिकोण की तरह लगता है। –
लेकिन निश्चित रूप से यह कोड उदाहरण भी स्ट्रिप करेगा ... यदि कोई है ... बस एक विचार :) –