2015-06-14 5 views
7

मैं एक XML फ़ाइल पढ़ रहा हूं जिसमें जर्मन, फ्रेंच, स्पेनिश, अंग्रेजी और पॉलिश टेक्स्ट शामिल है।प्रदर्शन (पॉलिश) वर्ण सही ढंग से

पॉलिश पत्र (जो सबसे अधिक परेशानी का कारण बना) मैं इस तरह यह करने की कोशिश की संभाल करने के लिए:

File file = new File(path); 
InputStream is = new FileInputStream(file); 
Reader reader = new InputStreamReader(is, charset); 

InputSource src = new InputSource(reader); 
src.setEncoding(charset.name()); 

SAXParserFactory factory = SAXParserFactory.newInstance(); 
SAXParser saxParser = factory.newSAXParser(); 

saxParser.parse(src, handler); 

समस्या मैं का सामना करना पड़ा है कि डिफ़ॉल्ट वर्णसेट में से कोई भी ठीक से पाठ को प्रदर्शित किया गया था। कुछ में इसमें कुछ प्रश्न हैं जिनमें कुछ अन्य वर्णों का संयोजन है उदा। ए ओ ..

इसे तोड़ने के लिए थोड़ा नीचे मैं जो काम करता है चारसेट परीक्षण करने के लिए एक और टुकड़ा लिखा है:

public static void main(String[] args){ 
     Charset charset = StandardCharsets.UTF_8; 
     String chars = "śłuna długie"; 
     System.out.println(new String(chars.getBytes(charset), charset)); 
} 

फिर हर एक परीक्षण किया लेकिन कुछ भी काम करता है .. मुझे आशा है कि आप एक विचार मिल गया है।

+3

अपने पहले कोड स्निपेट में आप कुछ भी आउटपुट नहीं करते हैं इसलिए यह बताना मुश्किल है कि क्या हो रहा है। दूसरा कोड स्निपेट काम करता है, 'śłuna długie' कंसोल पर सही ढंग से मुद्रित है। आप किस कंसोल का उपयोग करते हैं? * कहां * क्या आप इस पाठ को मुद्रित करने का प्रयास करते हैं? क्या आउटपुट डिवाइस उन अक्षरों का समर्थन करता है जिन्हें आप मुद्रित करना चाहते हैं? –

+0

पार्सर का सही कोड प्रदान करना मुश्किल है क्योंकि इसके बहुत सारे महत्वपूर्ण भाग हैं .. ठीक है, तो समस्या मेरे कंसोल हो सकती है .. इसके बारे में सोचा नहीं है। यह मेरे इंटेलिज आईडीईए – codewing

+0

का डिफ़ॉल्ट कंसोल है जो मेरे प्रोजेक्ट और आईडी एन्कोडिंग को 8 में बदलता है और यह काम करता है .. धन्यवाद दोस्त – codewing

उत्तर

0

मेरे समाधान: अपने आईडीई

की एन्कोडिंग मैं अपने आईडीई (IntelliJ) जो था "windows-1252", तथ्य यह है कि मैं इस पीसी पर खिड़कियां उपयोग कर रहा हूँ के कारण के डिफ़ॉल्ट एन्कोडिंग का प्रयोग किया बदलें।

तो मैंने इसे यूटीएफ -8 में बदल दिया और लघु परीक्षण कोड ने मेरे लिए ठीक काम किया।

संबंधित मुद्दे