में कनवर्ट करने के लिए कैसे करें मेरी आवश्यकता है जहां कोई क्लाइंट एएनएसआई एन्कोडिंग में फ़ाइल की आपूर्ति करेगा, लेकिन मेरा सिस्टम केवल यूनिकोड में फ़ाइल को सफलतापूर्वक पढ़ सकता है। तो मैं इस मुद्दे से कैसे निपटूं? मुझे पता है कि जब मैं फ़ाइल को "एन्कोड" करता हूं, तो यूनिकोड एन्कोडेड फ़ाइल को उठाया जाता है। क्लाइंट को हमारे अनुरोध का अनुपालन करना मुश्किल है। तो क्या इस फ़ाइल को यूनिकोड में कनवर्ट करने के लिए मेरे पास कोई बैच प्रोग्राम हो सकता है और फिर उठाया जा सकता है?* .txt फ़ाइल को यूनिकोड
उत्तर
recode नौकरी कर सकता था।
iconv
कि कर सकते हैं:
Usage: iconv [OPTION...] [FILE...]
Convert encoding of given files from one encoding to another.
Input/Output format specification:
-f, --from-code=NAME encoding of original text
-t, --to-code=NAME encoding for output
Information:
-l, --list list all known coded character sets
Output control:
-c omit invalid characters from output
-o, --output=FILE output file
-s, --silent suppress warnings
--verbose print progress information
-?, --help Give this help list
--usage Give a short usage message
-V, --version Print program version
Mandatory or optional arguments to long options are also mandatory or optional
for any corresponding short options.
For bug reporting instructions, please see:
<http://www.gnu.org/software/libc/bugs.html>.
तुम भी आसानी से अजगर में एन्कोडिंग परिवर्तित कर सकते हैं:
inf = open("infile.txt")
data = inf.read().decode("latin1")
inf.close()
outf = open("outfile.txt", "w")
outf.write(data.encode("utf-8"))
outf.close()
यहाँ एक Powershell समाधान
$lines = gc "pathToFile"
$lines | out-file -enconding Unicode
एनकोडिंग एएनएसआई और न ही यूनिकोड न तो कर रहे हैं है। आपको इनपुट फ़ाइल और यूनिकोड एनको के एएनएसआई कोडपेज को जानना होगा डिंग (UTF8 या UTF16 - ले या बीई) इससे पहले कि आप का सुझाव दिया उपकरणों में से एक का उपयोग कर सकते
का उपयोग करता है इच्छा है कि मैं इसे और अधिक बढ़ा सकता हूं। अधिकांश विंडोज उपयोगकर्ताओं के लिए, "यूनिकोड" का अर्थ यूटीएफ 32 है। अधिकांश पश्चिमी यूरोपीय भाषाएं लैटिन 1 कोडपेज का उपयोग करती हैं, इसलिए अधिकांश लोग मानते हैं कि "एएनएसआई" एन्कोडिंग है (फिर से, मैं अपने शब्द उपयोग के लिए एमएस को "सेव एज़" विकल्प में दोष देता हूं)। –
हम जोड़ सकते हैं कि नियंत्रण कक्ष-> क्षेत्रीय सेटिंग्स-> उन्नत विकल्प दिखाएंगे कि कौन सी एएनएसआई कोड-पेज स्थापित और उपयोग किए गए हैं। –
विंडोज सिस्टम पर, "यूनिकोड" आमतौर पर यूटीएफ -16 का मतलब है। –
मैं कुछ ऊपर उल्लेख किया उपकरणों के माध्यम से चला गया, उनमें से कई कमांड लाइन की आवश्यकता होती है (जैसे iconv के रूप में)।
मुझे विंडोज में फ़ाइलों को कनवर्ट करने का एक आसान तरीका मिला।
स्थापित Notepad2 (http://www.flos-freeware.ch/)। यह खुला स्रोत और मुफ्त है।
ओपन फाइल एएनएसआई एन्कोडिंग,
डबल क्लिक करें "एएनएसआई" तल पर शब्द,
इस तरह के "UTF8"
सहेजें फ़ाइल के रूप में नई एन्कोडिंग का चयन किया है।
यह काम करने के लिए केवल कुछ क्लिक हैं।
प्लस, आप बार-बार जांच करने के लिए सामग्री की आसानी से समीक्षा कर सकते हैं।
नोटपैड 2 नोटपैड पर विभिन्न लाभ हैं। हाइलाइट कोड, पूर्ववत करें/फिर आदि
: डी
मैं यह देखने में असफल रहा कि नोटपैड 2 जीयूआई का उपयोग करके एन्कोडिंग को बदलना कमांड लाइन का उपयोग करने से आसान है, खासकर कई फाइलों के साथ? – ehambright
जीयूआई कोई ब्रेनर नहीं है: एक्स कमांडलाइन निर्भरता की आवश्यकता है ... नोटपैड ++ बस क्लिक करें क्लिक करें ... – CodeFarmer
रूबी oneliner, Fwiw:
ruby -e 'STDOUT.write STDIN.read.force_encoding(Encoding::WINDOWS_1252).encode!(Encoding::UTF_8)' <infile.csv> outfile.csv
यदि आपका इनपुट फ़ाइल भयानक है आप रूबी स्क्रिप्ट के मोर्चे पर कील STDIN.binmode; STDOUT.binmode;
आवश्यकता हो सकती है।
- 1. php एक txt फ़ाइल
- 2. जावा, एक txt फ़ाइल
- 3. एक .txt फ़ाइल
- 4. ग txt फ़ाइल
- 5. पाइथन फ़ाइल नामों को यूनिकोड
- 6. एंड्रॉइड फ़ाइल इनपुट स्ट्रीम() txt फ़ाइल स्ट्रिंग
- 7. मैथमैटिका प्रिंट निर्यात [] एक .txt फ़ाइल
- 8. एक txt फ़ाइल कैसे खोलें और जावा
- 9. पोस्टग्रेस कॉपी कैसे करें बड़ी txt फ़ाइल
- 10. file_put_contents txt फ़ाइल नहीं बना रहे
- 11. पढ़ें बिग txt फ़ाइल, मेमोरी अपवाद से
- 12. यूनिकोड एन्कोडर फ़ाइल को लिखते समय
- 13. एक DataGridView में एक .txt फ़ाइल लाना
- 14. jQuery: लोड txt फ़ाइल और div
- 15. मिटा txt फ़ाइल से सभी डेटा - php
- 16. शक्तियों में txt फ़ाइल को csv में कनवर्ट करना
- 17. एक .txt फ़ाइल fscanning जब पहली पंक्ति को कैसे छोड़ें?
- 18. एक txt फ़ाइल में डेटा को ओवरराइट कैसे करें?
- 19. मैं एंड्रॉइड में .txt फ़ाइल को कैसे लिखूं?
- 20. हास्केल बाहरी txt फ़ाइल को सूची में लोड करें
- 21. किसी विशिष्ट पैकेज से txt फ़ाइल को पढ़ना जावा
- 22. बैच फ़ाइल में .txt फ़ाइल से टेक्स्ट प्रदर्शित करें
- 23. .NET में नकली फ़ाइल विधियां (जैसे फ़ाइल.कॉपी ("1.txt", "2.txt"))
- 24. स्ट्रीमिंग लॉग (txt) दर्शक
- 25. यूनिकोड
- 26. इनपुट से txt
- 27. जावा के साथ .txt फ़ाइल का अक्षरसेट एन्कोडिंग जांचने का कोई तरीका है?
- 28. मैं अपनी EXE फ़ाइल में एक TXT फ़ाइल को संसाधन कैसे जोड़ूं?
- 29. .txt फ़ाइल को हडोप के अनुक्रम फ़ाइल प्रारूप में कनवर्ट करने के लिए कैसे करें
- 30. TXT फ़ाइल में बैच/ढूंढें और संपादित करें
जब आप कहते हैं कि 'यूनिकोड', क्या आपका मतलब UTF8, UTF16, UTF32 करते हैं, या कुछ अन्य प्रतिनिधित्व? और यूनिकोड नहीं होने पर आप स्रोत कोड सेट को कैसे खोजेंगे? आप किस मंच पर हैं? –
अधिकांश लोगों को लगता UTF-32 = यूनिकोड। मैं इस विचार को जनता के बीच इतना प्रचलित होने के लिए एमएस और उनके "इस रूप में सहेजें" विकल्प दोषी ठहराते हैं। एक डेवलपर (जो बेहतर जानते हैं चाहिए) साझा देखने के लिए दु: खी। –
एमएस ज्यादातर यूसीएस -2 का उपयोग करता है, यूटीएफ -32 नहीं। – flodin