पर Jsoup विशेषता हटाने को मुझे समस्या है कि मैं कुछ ग्रंथों को फ़िल्टर करना चाहता हूं जिनमें HTML हो। मैं टैग्स को श्वेतसूची और साफ करने के लिए jsoup का उपयोग करता हूं जो बहुत अच्छा काम करता है।एचटीएमएल टैग
मुझे केवल समस्या है कि कुछ टैग में विशेषताओं, ज्यादातर शैली या कक्षाएं हो सकती हैं लेकिन अलग-अलग विशेषताएं भी हो सकती हैं। (नाम, लक्ष्य, ect।) इसे साफ करते समय कोई समस्या नहीं है क्योंकि वे अच्छी तरह से छीन लेते हैं लेकिन जब कुछ टैग्स को श्वेतसूची में अनुमति दी जाती है, तो गुणों के कारण अवरुद्ध हो जाते हैं। मूल श्वेतसूची शैली या वर्ग विशेषताओं को कवर करने के लिए प्रतीत नहीं होता है और मैं जो भी सामना कर रहा हूं उसे मैं शर्मिंदा नहीं कर सकता।
चूंकि मैं टैग की विस्तृत श्रृंखला को अनुमति देना चाहता हूं, लेकिन सफाई के दौरान उनमें से अधिकांश को हटा दें, मैं उन सभी टैग्स के लिए सभी विशेषताओं को जोड़ना नहीं चाहता हूं जिन्हें मैं अनुमति दे रहा हूं। सबसे आसान सभी टैग्स से सभी विशेषताओं को पट्टी करना होगा, क्योंकि मुझे उनमें से कोई दिलचस्पी नहीं है और फिर जांचें कि सादा टैग के साथ छीन लिया गया पाठ मान्य है या नहीं।
क्या कोई ऐसा फ़ंक्शन है जो सभी विशेषताओं या कुछ साधारण लूप को हटा देता है, दूसरा विकल्प श्वेतसूची को सभी विशेषताओं को अनदेखा करने और टैग पर श्वेतसूची को बताने के लिए कहता है।
संबंधित साथ upadted कोड: http://stackoverflow.com/questions/14303691/why-does-jsoup-remove-element-ids/14303971#14303971 –