ग्रहण चरित्र एन्कोडिंग

मैं जावा में .txt दस्तावेज़ स्कैन करने के लिए स्कैनर का उपयोग कर रहा हूं। हालांकि, जब मैं ग्रहण में .txt दस्तावेज़ खोलते हैं, मैं कुछ पात्रों मान्यता प्राप्त नहीं किया जा रहा है नोटिस, और वे कुछ है कि इस तरह दिखता है के साथ बदल रहे हैं:ग्रहण चरित्र एन्कोडिंग

ये अक्षर भी मुझे स्कैन नहीं दूँगी फ़ाइल

while(scan.hasNext)

स्वचालित रूप से झूठी लौटाता है (यदि ये वर्ण मौजूद नहीं हैं, तो मैं दस्तावेज़ को ठीक से स्कैन कर सकता हूं)।

तो, मैं इन पात्रों को पहचानने के लिए ग्रहण कैसे प्राप्त करूं ताकि मैं स्कैन कर सकूं? मैं उन्हें मैन्युअल रूप से हटा नहीं सकता क्योंकि दस्तावेज़ काफी बड़ा है। धन्यवाद।

स्रोत

2013-06-30 Derrek Whistle

इसका मतलब है कि फ़ाइल उस में प्रिंट न हो सकने कैरेक्टर हैं, या चरित्र आप (शायद डिफ़ॉल्ट) का उपयोग कर रहे सेट क्या है कि फाइल है नहीं है। –

जो फ़ाइल आप पढ़ रहे हैं उसे यूटीएफ -8 या कुछ अन्य एन्कोडिंग वर्ण होने चाहिए और जब आप उन्हें कंसोल पर प्रिंट करने का प्रयास करेंगे तो आपको कुछ अक्षर 'के रूप में प्राप्त होंगे। ऐसा इसलिए है क्योंकि डिफ़ॉल्ट कंसोल एन्कोडिंग ग्रहण में यूटीएफ -8 नहीं है। आपको इसे कॉन्फ़िगरेशन -> सामान्य -> एन्कोडिंग -> ड्रॉप डाउन से यूटीएफ -8 का चयन करके सेट करने की आवश्यकता है। नीचे स्क्रीनशॉट की जाँच करें:

enter image description here

स्रोत

2013-06-30 00:12:57

आप अपने पूरे ग्रहण कार्यस्थान के लिए वर्ण एन्कोडिंग बदलने के लिए, खिड़की के पास जाओ की जरूरत है -> प्राथमिकताएं। फिर सामान्य -> वर्कस्पेस के तहत, 'टेक्स्ट फ़ाइल एन्कोडिंग' को उचित वर्ण एन्कोडिंग में बदलें (इस मामले में, यूटीएफ -8)।

Eclipse Preferences - Changing Character Encoding

स्रोत

2014-02-28 16:44:01 HeavyE

ग्रहण चरित्र एन्कोडिंग

उत्तर

संबंधित मुद्दे