मेरे पास कुछ पीडीएफ हैं और मैं एक्रोबैट रीडर से HTML फॉर्म में टेक्स्ट को काट और पेस्ट करने का प्रयास कर रहा हूं। ऐसा लगता है कि इनमें से कुछ फाइलें टेक्स्ट एन्कोडिंग के लिए यूनिकोड का उपयोग करती हैं (इसलिए मुझे संदेह है), इसलिए जब मैं HTML फॉर्म (फ़ायरफ़ॉक्स पर) पेस्ट करने का प्रयास करता हूं तो मुझे पठनीय पाठ के बजाय हेक्स वर्णों के साथ छोटे बक्से मिलते हैं। समस्या यह नहीं है कि पीडीएफ को ओसीआर नहीं किया गया है - जब मैं एक्रोबैट प्रो में ऐसा करने की कोशिश करता हूं तो यह कहता है कि ऐसा नहीं हो सकता क्योंकि फ़ाइल में पहले से ही प्रस्तुत करने योग्य टेक्स्ट है। क्या इससे निपटने का कोई तरीका है? उदाहरण के लिए क्या मैं कुछ प्रकार के जावास्क्रिप्ट को उस रूप में जोड़ सकता हूं जो रूपांतरण करेगा?गैर-ASCII एन्कोडिंग के साथ पीडीएफ से कट-पेस्ट कैसे करें?
उत्तर
क्या आप फ़ाइल से कॉपी किए गए पाठ को नोटपैड या वर्ड या किसी अन्य प्रोग्राम जैसे पेस्ट पेस्ट करने में सक्षम हैं?
कुछ पीडीएफ फाइलों को विशेष जानकारी के बिना उत्पादित किया जाता है जो उनके द्वारा पाठ के सफल निष्कर्षण के लिए महत्वपूर्ण है। एडोब टूल्स द्वारा भी। असल में, ऐसी फाइलों में ग्लाइफ-टू-कैरेक्टर मैपिंग जानकारी नहीं होती है।
ऐसी फाइलें प्रदर्शित और मुद्रित की जाएंगी, लेकिन उनसे टेक्स्ट ठीक से कॉपी/निकाला नहीं जा सकता है।
उदाहरण के लिए, डिस्टिलर ऐसी फाइलें उत्पन्न करता है जब "सबसे छोटा फ़ाइल आकार" प्रीसेट का उपयोग किया जाता है।
यह संभव है कि पाठ में ऐसे वर्ण हों जो सही ढंग से कॉपी हो जाएं लेकिन आपका ब्राउज़र उपयुक्त फ़ॉन्ट की कमी के कारण उन्हें प्रदर्शित करने में असमर्थ है। एक पीडीएफ दस्तावेज में एम्बेडेड फोंट हो सकते हैं, इसलिए एडोब रीडर अक्षरों को ठीक दिखाता है, लेकिन ब्राउज़र में उन फोंट तक पहुंच नहीं है।
आप यहां वर्णों की प्रतिलिपि बनाने और पेस्ट करने का प्रयास कर सकते हैं (यह किसी भी तरह की समस्या के बारे में उपयोगी जानकारी हो सकता है)। आप Code200x fonts को भी डाउनलोड और इंस्टॉल कर सकते हैं, जिसमें आमतौर पर किसी भी चरित्र का सामना करना पड़ सकता है जिसे आप आम तौर पर सामना कर सकते हैं। (यह गारंटी नहीं है, लेकिन संभव है कि फ़ायरफ़ॉक्स आवश्यक होने पर स्वचालित रूप से उन फ़ॉन्ट्स का उपयोग करने में सक्षम होगा।)
फोंट का प्रयास किया, कोई मदद नहीं। साथ ही, जब मैंने चार्स को चिपकाया और आईडीई (कॉमोडो) ने कहा कि डिफ़ॉल्ट एन्कोडिंग सीपी -1252 उपयुक्त नहीं था, और जब मैं यूनिकोड में एन्कोडिंग में बदल गया तो यह खुश हो गया। – Steve
मैं एक ही समस्या है ... वास्तव में यह यहाँ समझाया गया है: http://forums.adobe.com/thread/915012
मेरे समाधान एक्रोबेट का निर्यात उपकरण का उपयोग करने के लिए वर्ड पीडीएफ कन्वर्ट करने के लिए और उसके बाद जानकारी मैं इसे से की जरूरत है निकालने था।
यह निराशाजनक है लेकिन वह काम है।
मुझे लगता है कि एक और समाधान छवियों (जेपीईजी, पीएनजी, आदि) में पीडीएफ को परिवर्तित करना है और फिर एक ओसीआर प्रक्रिया चलाएं।
मुझे एक ही समस्या थी, लेकिन मैंने वेब ब्राउजर (मेरे मामले में क्रोम) के साथ पीडीएफ फ़ाइल खोलकर इसे हल किया। कॉपी-एंड-पेस्टिंग गैर-ASCII एन्कोडिंग क्रोम में ठीक काम करता है।
- एक्रोबैट में टेक्स्ट का चयन करें।
- राइट-क्लिक करें और संदर्भ मेनू से "स्वरूपण के साथ प्रतिलिपि बनाएँ" का चयन करें।
- पाठ को संसाधित करने के लिए प्रगति पट्टी की प्रतीक्षा करें।
- शब्द दस्तावेज़ में पेस्ट करें।
हमें एक पीडीएफ फ़ाइल से एक्सेल में साइरिलिक्स कॉपी/पेस्ट करने की कोशिश करने में समान समस्या थी।
हमने पाया सबसे आसान समाधान ब्राउज़र (क्रोम, मोज़िला या ओपेरा) के साथ .pdf खोलना था और वर्ड, एक्सेल में टेक्स्ट कॉपी/पेस्ट करना था।
यह आईई के साथ काम नहीं करता था, जैसा कि अपेक्षित था।
- 1. फिक्स पीडीएफ एन्कोडिंग
- 2. डेटाबेस, वर्ण एन्कोडिंग, पीडीएफ और एक्सएमएल
- 3. यूटीएफ -8 एन्कोडिंग के साथ knit2html कैसे करें?
- 4. ghostscript के साथ पीडीएफ में पीडीएफ कैसे परिवर्तित करते हैं?
- 5. ब्राउज़र से पीडीएफ कैसे प्रिंट करें
- 6. पीडीएफ कैसे उत्पन्न करें?
- 7. PHP के साथ पीडीएफ फाइल कैसे बनाएं?
- 8. पीडीएफबॉक्स (दूषित पीडीएफ) के साथ डाउनलोड करने योग्य पीडीएफ कैसे उत्पन्न करें?
- 9. एचटीएमएल एन्कोडिंग के साथ जेसनआरसल्ट
- 10. पोस्टग्रेर्स सीओपीवाई फ़ाइल एन्कोडिंग LATIN1 के साथ एन्कोडिंग के साथ तालिका में यूटीएफ
- 11. रूस पीडीएफ लिखने के
- 12. पीडीएफ असीमित रूप से डाउनलोड करें
- 13. .NET में स्मार्टकार्ड के साथ पीडीएफ फाइलों को डिजिटल रूप से कैसे हस्ताक्षर करें?
- 14. कॉपी करने योग्य टेक्स्ट के साथ QGraphicsScene से पीडीएफ फ़ाइलों का उत्पादन कैसे करें?
- 15. pdfbox साथ पीडीएफ से एन्क्रिप्शन निकालने के लिए, qpdf तरह
- 16. जावा के साथ ग्राफिक्स ऑब्जेक्ट से कई पेजों के साथ पीडीएफ कैसे बनाएं और इसे
- 17. पीडीएफ प्रोग्रामेटिक रूप से
- 18. डीजेगो/पायथन: उचित भाषा के साथ पीडीएफ उत्पन्न करें
- 19. गिट से पीडीएफ लॉगबुक उत्पन्न करें
- 20. प्रोग्रामेटिक रूप से पीडीएफ फाइलों में जावास्क्रिप्ट इंजेक्ट कैसे करें?
- 21. सी #: एन्कोडिंग के माध्यम से साइकिल
- 22. सिंटेक्स हाइलाइटिंग के साथ पीडीएफ/छवि में निर्यात करें - emacs
- 23. पीडीएफ फाइलों के साथ पीडीएफ फाइलों को सम्मिलित करें रिक्त पृष्ठ
- 24. मशीनी पेज एन्कोडिंग कैसे सेट करें?
- 25. पीडीएफबॉक्स - एक छवि से पीडीएफ उत्पन्न करने के साथ समस्या
- 26. node.js "अनुरोध" मॉड्यूल के साथ प्रतिक्रिया एन्कोडिंग
- 27. एक HTML पृष्ठ में पीडीएफ फ़ाइल का एमआईएम एन्कोडिंग
- 28. रिपोर्टिंग सेवाओं से पीडीएफ प्रदर्शित करें
- 29. पीडीएफ फ़ाइल से लेटेक्स कोड प्राप्त करें
- 30. पीडीएफ प्रोग्रामेटिक रूप से
वही परिणाम कोई फर्क नहीं पड़ता कि मैं इसे पेस्ट करता हूं - नोटपैड, वर्ड, आदि। मुझे लगता है कि आप पीडीएफ फ़ाइल के बारे में सही हैं। अगर मैं एक्रोबैट प्रो में यह फ़ाइल खोलता हूं, तो इसके कुछ टेक्स्ट कॉपी करें, फिर चिपचिपा नोट खोलें और टेक्स्ट पेस्ट करने का प्रयास करें, मुझे अक्षरों के बजाय बॉक्स मिलते हैं। तो यहां तक कि एक्रोबैट भी इस पाठ से निपट नहीं सकता है। – Steve