मैं एचटीएमएल कोड को स्वच्छ करने के लिए कक्षा/उपयोग इत्यादि की तलाश में हूं यानी एक्सएसएस और इसी तरह के हमलों से बचने के लिए खतरनाक टैग, विशेषताओं और मूल्यों को हटा दें।एक्सएसएस हमलों को रोकने के लिए जावा में HTML कोड को कैसे स्वच्छ किया जाए?
मुझे समृद्ध टेक्स्ट एडिटर (जैसे TinyMCE) से एचटीएमएल कोड मिलता है लेकिन इसे TinyMCE सत्यापन ("डेटा सबमिट फॉर्म ऑफ साइट") को कम करने के लिए दुर्भावनापूर्ण तरीके से भेजा जा सकता है।
वहाँ के रूप में सरल कुछ भी PHP में InputFilter के रूप में उपयोग करने के लिए है? बिल्कुल सही समाधान मैं उस तरह काम करता है (प्रक्षालक मान HtmlSanitizer कक्षा में समझाया गया है) की कल्पना कर सकते हैं:
String unsanitized = "...<...>..."; // some potentially
// dangerous html here on input
HtmlSanitizer sat = new HtmlSanitizer(); // sanitizer util class created
String sanitized = sat.sanitize(unsanitized); // voila - sanitized is safe...
अद्यतन - सरल समाधान, बेहतर! संभवतः अन्य पुस्तकालयों/ढांचे पर छोटी बाहरी निर्भरताओं के साथ छोटे उपयोग वर्ग - मेरे लिए सबसे अच्छा होगा।
इसके बारे में कैसे?
तो ग्राहकों रूपों जो तब fx के आकार में प्रदर्शित किए जाते हैं प्रस्तुत करने में सक्षम होने के लिए क्या आप मूल रूप से चाहते हैं। एक अतिथि पुस्तक? और आप चाहते हैं कि वे एचटीएमएल का उपयोग करने में सक्षम हों लेकिन आप अभी भी दुर्भावनापूर्ण उपयोगकर्ताओं को हैकिंग-प्रयासों को अवरुद्ध करने में सक्षम होना चाहते हैं? या क्या मुझे यह सब गलत लगता है ...? – Latze
@Latze: मैं (अपने ब्राउज़र के माध्यम से उन) चाहते ग्राहकों (रिच टेक्स्ट संपादक के माध्यम से HTML स्वरूप - TinyMCE) richtext सामग्री प्रस्तुत करने के लिए, लेकिन जाँच करें और किसी भी संभावित खतरनाक (असुरक्षित) सामग्री निकालने के लिए। मुझे नहीं पता कि इस संदर्भ में आप जिस एफएक्स और गेस्टबुक का उल्लेख करते हैं। – WildWezyr
आह! मैं इसे एक शॉट देने, मुझे मिनट – Latze