का उपयोग कर HTML को सादे टेक्स्ट में कनवर्ट करने का सबसे अच्छा तरीका मैं एक ऐसे प्रोजेक्ट पर काम कर रहा हूं जिसमें बड़ी मात्रा में HTML सामग्री को सादे/टेक्स्ट में परिवर्तित करना शामिल है। मेरे पास एक कस्टम लिखित मॉड्यूल है जो नौकरी ठीक करता है, लेकिन मुझे आश्चर्य है कि नौकरी पाने में मदद के लिए कुछ मानक उपकरण हैं या नहीं।पाइथन
BeautifulSoup एक और विकल्प है:
यह बहुत अच्छी तरह से काम करता है –
साइट अब हारून के बाद से पहुंच योग्य नहीं है, लेखक अब नहीं है। –
लेकिन कोड https://github.com/aaronsw/html2text –