2012-01-16 16 views
5

के भीतर यूनानी अक्षरों की खोज में मुझे नहीं पता कि पीडीएफ में यूनानी अक्षरों को कैसे खोजा जाए। मैं यह कैसे कर सकता हूँ? आदर्श रूप से मैं इसे पीडीएफ दर्शक सॉफ्टवेयर पैकेज में कर सकता हूं।पीडीएफ दस्तावेज़

मैंने देखा है कि फोरम पोस्टिंग से, यूनानी अक्षरों मानक यूनिकोड वर्णों के बाहर गिरते हैं जो पीडीएफ विनिर्देश में शामिल हैं।

+0

क्यों आप जांच नहीं सकते कि पत्र मेल खाते हैं [\ u0391- \ u03A9, \ u03B1- \ u03C9]? –

+0

जब मैं xpdf से pdftotext कमांड का उपयोग करता हूं, ग्रीक वर्ण लैटिन वर्णों के रूप में बाहर आते हैं। मुझे लगता है कि ऐसा इसलिए है क्योंकि pdftotext utf-8 में आउटपुट करता है जिसमें ग्रीक वर्णमाला [लिंक] शामिल नहीं है (http://superuser.com/questions/220363/cleaning-up-pdftotext-font-issues) क्या pdf2text आउटपुट सेटिंग मैं उपयोग करता हूं जिसमें यूनानी वर्ण शामिल होंगे? – Chogg

+0

अधिमानतः हालांकि, मैं इन वर्णों को पीडीएफ-एक्सचेंज व्यूअर जैसे प्रोग्राम में खोजूंगा। मैं केवल उन अक्षरों को दर्ज कर सकता हूं जिन्हें मैं एक खोज बॉक्स में टाइप करता हूं, इसलिए मुझे नहीं पता कि इस तथ्य को कैसे इंगित किया जाए कि मैं यूनिकोड एन्कोडिंग (उदाहरण के लिए \ u0391) बनाने वाले वर्णों के बजाय एक यूनिकोड एन्कोडिंग खोजना चाहता हूं। देखो मेरा मतलब है। – Chogg

उत्तर

2

मैंने काम किया है कि मैं क्या गलत कर रहा था, और यह काफी बुनियादी था।

मैं सिर्फ चरित्र मानचित्र का उपयोग करके या ग्रीक वर्णमाला कीबोर्ड αβγ पर स्विच करके ग्रीक अक्षर की खोज कर सकता हूं।

यह आम तौर पर यूनानी पात्रों को पाता है। कई पीडीएफ ग्रीक अक्षरों को सही ढंग से नहीं पहचानते हैं और इसके बजाय अन्य आकारों के साथ चरित्र के लिए एक gobbledygook अनुमान है। यह संभवतः इस बात पर निर्भर करता है कि पीडीएफ कैसे बनाया गया था।

संबंधित मुद्दे