के बीच अंतर के बीच कोई अंतर मुझे समझा सकता है? और
मेरे पास बाइनरी रूप और स्थान में डेटाबेस में संग्रहीत HTML डेटा है जिसमें
या  
या कभी-कभी  
हो सकता है।
भी मुद्दा है जब मैं सादे पाठ में इस HTML कन्वर्ट JSoup lib
का उपयोग कर इसे यह ठीक से परिवर्तित लेकिन अगर मैं String.contains (मेरे स्ट्रिंग) जावा की विधि का उपयोग करें। ऐसा लगता है कि एचटीएमएल डेटा
है जिसमें से  
है। स्ट्रिंग किसी भी विपरीत में नहीं मिला है।
उदाहरण:
HTML1: This is my test string
HTML2: This is my test string
अगर मैं सादे पाठ में परिवर्तित JSoup का उपयोग कर। यह रिटर्न
एचटीएमएल 1: यह अपने परीक्षण स्ट्रिंग
एचटीएमएल 2: यह मेरा परीक्षण स्ट्रिंग
है लेकिन फिर भी दोनों स्ट्रिंग ही नहीं हैं। ऐसा क्यों है?
वहाँ किसी भी तरह से मौजूदा पाठ की एनकोड शैली को खोजने के लिए है एक क्षैतिज खाली स्थान के चरित्र है? – Ketan