10

मैं जावा में .txt दस्तावेज़ स्कैन करने के लिए स्कैनर का उपयोग कर रहा हूं। हालांकि, जब मैं ग्रहण में .txt दस्तावेज़ खोलते हैं, मैं कुछ पात्रों मान्यता प्राप्त नहीं किया जा रहा है नोटिस, और वे कुछ है कि इस तरह दिखता है के साथ बदल रहे हैं:ग्रहण चरित्र एन्कोडिंग

ये अक्षर भी मुझे स्कैन नहीं दूँगी फ़ाइल

while(scan.hasNext) 

स्वचालित रूप से झूठी लौटाता है (यदि ये वर्ण मौजूद नहीं हैं, तो मैं दस्तावेज़ को ठीक से स्कैन कर सकता हूं)।

तो, मैं इन पात्रों को पहचानने के लिए ग्रहण कैसे प्राप्त करूं ताकि मैं स्कैन कर सकूं? मैं उन्हें मैन्युअल रूप से हटा नहीं सकता क्योंकि दस्तावेज़ काफी बड़ा है। धन्यवाद।

+0

इसका मतलब है कि फ़ाइल उस में प्रिंट न हो सकने कैरेक्टर हैं, या चरित्र आप (शायद डिफ़ॉल्ट) का उपयोग कर रहे सेट क्या है कि फाइल है नहीं है। –

उत्तर

15

जो फ़ाइल आप पढ़ रहे हैं उसे यूटीएफ -8 या कुछ अन्य एन्कोडिंग वर्ण होने चाहिए और जब आप उन्हें कंसोल पर प्रिंट करने का प्रयास करेंगे तो आपको कुछ अक्षर 'के रूप में प्राप्त होंगे। ऐसा इसलिए है क्योंकि डिफ़ॉल्ट कंसोल एन्कोडिंग ग्रहण में यूटीएफ -8 नहीं है। आपको इसे कॉन्फ़िगरेशन -> सामान्य -> ​​एन्कोडिंग -> ड्रॉप डाउन से यूटीएफ -8 का चयन करके सेट करने की आवश्यकता है। नीचे स्क्रीनशॉट की जाँच करें:

enter image description here

13

आप अपने पूरे ग्रहण कार्यस्थान के लिए वर्ण एन्कोडिंग बदलने के लिए, खिड़की के पास जाओ की जरूरत है -> प्राथमिकताएं। फिर सामान्य -> ​​वर्कस्पेस के तहत, 'टेक्स्ट फ़ाइल एन्कोडिंग' को उचित वर्ण एन्कोडिंग में बदलें (इस मामले में, यूटीएफ -8)।

Eclipse Preferences - Changing Character Encoding

संबंधित मुद्दे