2012-06-20 7 views
7

मेरे पास बंगाली भाषा में एक एक्सेल फ़ाइल है। बंगाली पाठ को सही तरीके से प्रदर्शित करने के लिए मुझे पीसी पर स्थापित बंगाली फोंट की आवश्यकता है।बंगाली-भाषा पाठ यूनिकोड सीएसवी फ़ाइल में प्रदर्शित नहीं है

मैंने एक्सेल फ़ाइल को Office 2010 का उपयोग कर CSV में परिवर्तित कर दिया। लेकिन यह केवल '?' दिखाता है बंगाली पात्रों के बजाय अंक। फिर मैंने उसी समस्या के साथ रूपांतरण के लिए Google डॉक्स का उपयोग किया, लेकिन '?' के बजाय अपठनीय पात्रों के साथ। मैंने उस फ़ाइल से निष्कर्षों को एक HTML फ़ाइल में चिपकाया और इसे अपने ब्राउज़र में असुरक्षित रूप से देखने का प्रयास किया।

मुझे बंगाली में .xlsx फ़ाइल से CSV फ़ाइल प्राप्त करने के लिए क्या करना चाहिए ताकि मैं इसे एक MySQL डेटाबेस में आयात कर सकूं?

संपादित करें: this SO प्रश्न में स्वीकार किए गए उत्तर ने मुझे Google डॉक्स पर जाने दिया।

उत्तर

3

प्रश्न Excel to CSV with UTF8 encoding के सवालों के जवाब में, Google डॉक्स को Excel के विपरीत, सीएसवी को ठीक से सहेजना चाहिए, जो सभी वर्णों को नष्ट कर देता है जो उपयोग किए जाने वाले "एएनएसआई" एन्कोडिंग में प्रतिनिधित्व नहीं कर रहे हैं। लेकिन शायद उन्होंने इसे बदल दिया, या कुछ गलत, या स्थिति का विश्लेषण गलत है।

एमएस ऑफिस प्रोग्राम में संसाधित बांग्ला (बंगाली) को ठीक से एन्कोड करने के लिए, किसी भी "बांग्ला फोंट" की आवश्यकता नहीं होनी चाहिए, क्योंकि एरियल यूनिकोड एमएस फ़ॉन्ट (कार्यालय के साथ भेज दिया गया) में बांग्ला पात्र शामिल हैं। तो क्या डेटा वास्तव में कुछ गैर-मानक एन्कोडिंग में है जो विशेष रूप से एन्कोडेड फ़ॉन्ट पर निर्भर करता है? उस स्थिति में, इसे पहले यूनिकोड में परिवर्तित किया जाना चाहिए, हालांकि संभवतः इसे किसी भी तरह प्रोग्रामों का उपयोग करके प्रबंधित किया जा सकता है जो लगातार उस विशिष्ट फ़ॉन्ट का उपयोग करते हैं।

एक्सेल में, सेव एज़ का उपयोग करते समय, आप "यूनिकोड टेक्स्ट (* .txt)" का चयन कर सकते हैं। यह यूटीएफ -16 एन्कोडिंग में डेटा को टीएसवी (टैब-पृथक मान) के रूप में सहेजता है। इसके बाद आपको इसे कॉमा को टैब के बजाय विभाजक के रूप में बदलने और/या यूटीएफ -16 से यूटीएफ -8 तक बदलने की आवश्यकता हो सकती है। लेकिन यह केवल तभी काम करता है जब मूल डेटा ठीक से एन्कोड किया गया हो।

+0

उस रूपांतरण को कॉमा को टैब के बजाय विभाजक के रूप में कैसे उपयोग करें, और/या यूटीएफ -16 से यूटीएफ -8 तक कैसे करें? एक्सेल फ़ाइल ने बांग्ला फोंट को अच्छी तरह से दिखाया। इसलिए मैं मान सकता हूं कि मूल डेटा ठीक से एन्कोड किया गया था। सही ? –

+0

मैंने 'as asode' प्रकार को 'यूनिकोड टेक्स्ट (.txt)' के रूप में चुनने का रूपांतरण किया, लेकिन फिर भी वे '?' अंक पहले के रूप में दिखाई दिया। –

+0

@Istiaque अहमद, यह वास्तव में मूल डेटा की तरह दिखता है ठीक से एन्कोड नहीं किया गया है। यदि यह गैर-मानक 8-बिट एन्कोडिंग का उपयोग करता है, तो यह उन प्रोग्रामों पर ठीक दिख सकता है जो एक विशिष्ट फ़ॉन्ट का उपयोग करते हैं लेकिन सामान्य फोंट का उपयोग होने पर काम नहीं करते हैं, और डेटा रूपांतरण डेटा को गड़बड़ कर सकते हैं। आप किस बांग्ला फ़ॉन्ट का उपयोग कर रहे हैं? –

संबंधित मुद्दे