2012-09-22 21 views
7

मेरे पास एक टेक्स्ट संपादन प्रोग्राम है जो इसे आउटपुट को पीडीएफ फाइल में सहेजता है।iText, यूनिकोड वर्ण और जावा

यह सभी पाठ को पीडीएफ शब्दकोश में भी सहेजता है जिससे इसे फिर से पढ़ा जा सकता है। समस्या यह है कि मेरे मूल भाषा के पात्रों जैसे č, ć, đ, ž, š बहुत आम हैं ...

जब मैं अपने कार्यक्रमों में जीआईआई में उन पात्रों को लिखता हूं, तो यह ठीक है, वे सभी एपीर (मैं हूं (वर्तमान में) जावा के एरियल फ़ॉन्ट का उपयोग कर)।

जब मैं इसे सहेजता हूं और पीडीएफ खोलता हूं तो एडोब रीडर, č i ć गायब हैं और đ, ž और š मुद्रित हैं जैसा उन्हें करना चाहिए। मैं एक कस्टम (ट्रू टाइप) फ़ॉन्ट (BookAntiqua, here से डाउनलोड का उपयोग कर रहा हूँ।

इस एन्कोडिंग में एक समस्या है, या फ़ॉन्ट अपने आप में (यह डीजे, जेड, एस अक्षर) का समर्थन नहीं करता है?

इसके अलावा, जब मैं अपने प्रोग्राम में पीडीएफ लोड करता हूं, तो गायब अक्षरों को अभी भी गायब कर दिया जाता है और đ, ž, š ⎕ symboles और इसी तरह से स्वैप किए जाते हैं ... क्या यह एक समस्या है कि पीडीएफ कैसे लिखा जाता है या क्या कुछ और है?

नीचे की रेखा है, मुझे लगता है कि उन पांच गुण मेरे कार्यक्रमों में जीयूआई और पीडीएफ दस्तावेज में दिखाई दे रहे हैं और उन्हें पीडीएफ के शब्दकोश से ठीक से पुनर्प्राप्त किया जाता है।

उत्तर

3

मुझे एक ही समस्या थी। मैंने उन अक्षरों का समर्थन करने वाले फ़ॉन्ट को बदलने के साथ हल किया है, नाम भूल गए हैं, शायद एरियल यूनिकोड? - प्रयोग करने की आवश्यकता है कि कौन सा फ़ॉन्ट है- मैंने उस फ़ॉन्ट को पीडीएफ में एम्बेड किया है। वह सही था। मेरा नाम उन अजीब वर्ण :)

संपादित में से कुछ हैं: वहाँ एक नमूना here इसे कैसे करना है, और यह क्षेत्र के लिए भी निर्धारित करते हैं, और here एक और कोड स्निपेट है, जो काम आते हुए हो सकता है।

+0

मुझे पता है कि फ़ॉन्ट को पीडीएफ में कैसे एम्बेड किया जाए, यह समस्या नहीं है, ऐसा लगता है कि समस्या उस फ़ॉन्ट में है जिसका उपयोग मैं कर रहा हूं ... मैं थोड़ी देर के लिए देख रहा हूं ... क्या आप मुझे BookAntiqua या TimesNewRoman जैसा कोई फोंट सुझाएं और जो यूनिकोड वर्णों का भी समर्थन करता है? –

+0

@IvanKarlovic नहीं, मैं नाम भूल गया, यह 6 या अधिक साल पहले की तरह था। निश्चित रूप से यदि आप अपने फ़ॉन्ट को सही में बदलते हैं और पीडीएफ में एम्बेड करते हैं तो समस्या हल हो जाएगी, लेकिन आपको इसे Google पर करने की आवश्यकता होगी। यहां यह एक सूची है http://en.wikipedia.org/wiki/Unicode_font –

+0

मुझे फ़ॉन्ट मिला और इससे मदद मिली, लेकिन इससे मेरी समस्या हल नहीं हुई। पीडीएफ से पढ़ा गया पाठ अभी भी उन पात्रों को मुद्रित नहीं करता है। मैं भी इस tryed: 'सार्वजनिक स्थैतिक स्ट्रिंग unicodize (स्ट्रिंग स्ट्रिंग) \t { \t \t string.replace (" सी ","/u0106 "); \t \t string.replace ("ć", "/ u0107"); \t \t string.replace ("Č", "/ u010C"); \t \t string.replace ("č", "/ u010D"); \t \t string.replace ("Đ", "/ u0110"); \t \t string.replace ("đ", "/ u0111"); \t \t string.replace ("Š", "/ u0160"); \t \t string.replace ("š", "/ u0161"); \t \t string.replace ("Ž", "/ u017D"); \t \t स्ट्रिंग।प्रतिस्थापित करें ("ž", "/ u017E"); \t \t वापसी स्ट्रिंग; \t \t} ' –

संबंधित मुद्दे