2010-05-13 10 views
8

में UTF-8 में HTML से कन्वर्ट करने के लिए मैं HTML संस्थाओं के साथ एक ASCII स्ट्रिंग है, जैसे,:कैसे जावा

à 
¨ 
ç 

मैं इस स्ट्रिंग की जरूरत है उन संस्थाओं के बिना हो सकता है और उन्हें UTF-8 वर्ण में परिवर्तित करने के । क्या जावा में ऐसा करने का कोई आसान तरीका है?

कहाँ:

Clazz.method("aà","UTF-8") 

रिटर्न 'एए'

या कुछ है कि पसंद है?

+0

आपका मतलब है 'ए' के ​​बजाय आपके पास है और agrave; ? उदाहरण के लिए * "c'est-à-dire" * के बजाय * आपके पास * "c'est- & agrave; -dire" * है? (आप जानते हैं कि एएससीआईआईआई केवल 128 कोडपॉइंट्स को सही करता है? 'à' ** ** एक ASCII वर्ण नहीं है) – SyntaxT3rr0r

+1

ठीक है, मैंने यह देखने के लिए आपकी पोस्ट संपादित की है कि यह आपके प्रश्न में एक एन्कोडिंग समस्या थी। – SyntaxT3rr0r

+0

जिस तरह से आप सवाल पूछते हैं वह थोड़ा अजीब है, क्योंकि एचटीएमएल और यूटीएफ -8 दो पूरी तरह से अलग चीजें हैं - एचटीएमएल एक फ़ाइल प्रारूप है जबकि यूटीएफ -8 एक चरित्र एन्कोडिंग है। एचटीएमएल फाइलों में एक अक्षर एन्कोडिंग है, यानी आपके पास एक HTML फ़ाइल हो सकती है जो यूटीएफ -8 एन्कोडेड है, आईएसओ -885 9 -1 एन्कोडेड इत्यादि। – Jesper

उत्तर