के भीतर यूनानी अक्षरों की खोज में मुझे नहीं पता कि पीडीएफ में यूनानी अक्षरों को कैसे खोजा जाए। मैं यह कैसे कर सकता हूँ? आदर्श रूप से मैं इसे पीडीएफ दर्शक सॉफ्टवेयर पैकेज में कर सकता हूं।पीडीएफ दस्तावेज़
मैंने देखा है कि फोरम पोस्टिंग से, यूनानी अक्षरों मानक यूनिकोड वर्णों के बाहर गिरते हैं जो पीडीएफ विनिर्देश में शामिल हैं।
क्यों आप जांच नहीं सकते कि पत्र मेल खाते हैं [\ u0391- \ u03A9, \ u03B1- \ u03C9]? –
जब मैं xpdf से pdftotext कमांड का उपयोग करता हूं, ग्रीक वर्ण लैटिन वर्णों के रूप में बाहर आते हैं। मुझे लगता है कि ऐसा इसलिए है क्योंकि pdftotext utf-8 में आउटपुट करता है जिसमें ग्रीक वर्णमाला [लिंक] शामिल नहीं है (http://superuser.com/questions/220363/cleaning-up-pdftotext-font-issues) क्या pdf2text आउटपुट सेटिंग मैं उपयोग करता हूं जिसमें यूनानी वर्ण शामिल होंगे? – Chogg
अधिमानतः हालांकि, मैं इन वर्णों को पीडीएफ-एक्सचेंज व्यूअर जैसे प्रोग्राम में खोजूंगा। मैं केवल उन अक्षरों को दर्ज कर सकता हूं जिन्हें मैं एक खोज बॉक्स में टाइप करता हूं, इसलिए मुझे नहीं पता कि इस तथ्य को कैसे इंगित किया जाए कि मैं यूनिकोड एन्कोडिंग (उदाहरण के लिए \ u0391) बनाने वाले वर्णों के बजाय एक यूनिकोड एन्कोडिंग खोजना चाहता हूं। देखो मेरा मतलब है। – Chogg