क्या किसी भी पीडीएफ की सामग्री को निकालने का कोई तरीका है? (मेरे पास अकादमिक कागजात का एक बड़ा फ़ोल्डर है, जो दुख की बात है कि "1010.3423.pdf" जैसे लेबल हैं। मैं उन्हें कुछ समझदारी से नाम देने के लिए एक बैश स्क्रिप्ट लिखना चाहता हूं, जिसमें पहले कुछ पंक्तियों को गुगल करना शामिल है।)क्या पैश से पीडीएफ की सामग्री निकालने का कोई तरीका है?
5
A
उत्तर
3
pdftotext है, जो आपको पीडीएफ फ़ाइल से शीर्षक और लेखकों को प्राप्त करने में मदद कर सकता है। फिर आप इसे Google पर उपयोग कर सकते हैं, या स्वयं फ़ाइल नाम उत्पन्न कर सकते हैं।
3
पाठ निकालने के लिए pdftotext आज़माएं? http://en.wikipedia.org/wiki/Pdftotext
1
पीडीएफ 2 एक्सएमएल आपको अधिक विस्तृत जानकारी मिलेगा, मैं पिछले साल ऐसी उपयोगिता की तलाश में हूं, और मुझे लगता है कि pdf2xml सबसे अच्छा है।
संबंधित मुद्दे
- 1. पीडीएफ से डेटा निकालने का सबसे आसान तरीका क्या है?
- 2. बिट्स की सरणी से निकालने का कोई भी स्मार्ट तरीका?
- 3. क्या दिन का समय निकालने का कोई बेहतर तरीका है?
- 4. डब्ल्यूसीएफ: क्या एक्सटेंशनडेटा फ़ील्ड को निकालने का कोई तरीका है?
- 5. एक पीडीएफ से दूसरे पीडीएफ में सामग्री की प्रतिलिपि
- 6. क्या आईफ़्रेम की सामग्री से मूल URL प्राप्त करने का कोई तरीका है?
- 7. पूछताछ की रैंकिंग निकालने का तरीका परिणाम
- 8. पीडीएफ से छवि को निकालने/सीसीआईटीटीएफएक्सडेकोड फ़िल्टर
- 9. क्या एक्लिप्स में पिछली जगहों को स्वचालित रूप से निकालने का कोई तरीका है?
- 10. रुबी में, क्या ऐरे में केवल 1 मैच को आसानी से निकालने का कोई तरीका है?
- 11. क्या maven pom.xml से अप्रयुक्त निर्भरताओं को निकालने का कोई आसान तरीका है?
- 12. पीडीएफ.जेएस में पीडीएफ को गठबंधन करने का कोई तरीका है?
- 13. VS2010: निकालने का तरीका/एक्सप्लोरर
- 14. चींटी मैक्रोडेफ़: क्या तत्व पैरामीटर की सामग्री प्राप्त करने का कोई तरीका है?
- 15. क्या YQL को HTML वापस करने का कोई तरीका है?
- 16. क्या S3 पर होस्ट की गई सामग्री के साथ index.html कार्यक्षमता रखने का कोई तरीका है?
- 17. क्या स्थानीय निर्देशिका की सामग्री को ftp में सूचीबद्ध करने का कोई तरीका है?
- 18. "टैग की गईं पीडीएफ" क्या है?
- 19. पीडीएफ फ़ाइल से सामग्री की एक तालिका बनाएं
- 20. क्या सबडोमेन से जेसन लोड करने का कोई तरीका है?
- 21. क्या पीडीएफ से पासवर्ड को प्रोग्रामेटिक रूप से पासवर्ड निकालने के लिए लाइब्रेरी मौजूद है?
- 22. क्या माता-पिता फ्रेम पर IFRAME ओवरफ़्लो से सामग्री रखने का कोई तरीका है?
- 23. क्या/proc की सामग्री का अर्थ है/
- 24. फ्लैश के अंदर HTML सामग्री दिखाने का कोई तरीका है?
- 25. क्या ट्वीट की पसंदीदा गिनती पाने का कोई तरीका है?
- 26. क्या एडब्ल्यूएस खाते की उम्र जानने का कोई तरीका है?
- 27. क्या CGPoints की तुलना करने का कोई तरीका है?
- 28. क्या अलर्ट बॉक्स की उत्पत्ति पाने का कोई तरीका है?
- 29. क्या फेसबुक समूहों से सामग्री को स्क्रैप करने का कोई तरीका है?
- 30. कार्यात्मक पीडीएफ परीक्षण (पीडीएफ सामग्री का स्वचालित परीक्षण)
संभावित डुप्लिकेट [पीडीएफ से स्वरूपित पाठ सामग्री को निकालने के तरीके] (http://stackoverflow.com/questions/2196621/how-to-extract-formatted-text-content-from-pdf) –