मैंने पीडीएफ फाइलों से पाठ निकालने के लिए दोनों pyPdf और pdfMiner के साथ प्रयोग किया है। मेरे पास कुछ असभ्य पीडीएफ हैं जो केवल पीडीएफएमनर सफलतापूर्वक निकालने में सक्षम है। मैं संपूर्ण फ़ाइल के लिए पाठ निकालने के लिए कोड here का उपयोग कर रहा हूं। हालांकि, मैं वास्तव में प्रति पृष्ठ आधार पर पाठ निकालना चाहता हूं जैसे कि getPage(i).extractText()
कार्यक्षमता pyPdf में। क्या किसी को पता है कि पीडीएफएमनर का उपयोग कर प्रति पेज टेक्स्ट निकालने का तरीका कैसे है?पायथन पीडीएफमिनर के साथ प्रति पेज टेक्स्ट निकालें?
5
A
उत्तर
6
for pageNumber, page in enumerate(PDFDocument.get_pages()):
if pageNumber == 42:
#do something with the page
एक बहुत अच्छा लेख here है।
संबंधित मुद्दे
- 1. टेक्स्ट से JSON निकालें
- 2. पायथन के साथ टेक्स्ट-खान पीडीएफ फाइलें?
- 3. टेक्स्ट से टेक्स्ट निकालें, लेटेक्स टैग
- 4. हाइपरलिंक निकालें लेकिन टेक्स्ट रखें?
- 5. पायथन byRef // प्रति
- 6. रंग प्रति एनएसटीबल व्यू टेक्स्ट
- 7. वेब पेज से टेक्स्ट
- 8. विशिष्ट टेक्स्ट लाइनों को निकालें?
- 9. पायथन - टेक्स्ट
- 10. टेक्स्ट एचटीएमएल कैनवास से पथ निकालें
- 11. टेक्स्ट फ़ाइल की पंक्तियों से डेटा निकालें
- 12. sed/awk: टेक्स्ट स्ट्रीम से पैटर्न निकालें
- 13. टेक्स्ट स्ट्रीम में पहला शब्द निकालें
- 14. पायथन Gtk.Entry प्लेसहोल्डर टेक्स्ट
- 15. टेक्स्ट फ़ाइल से डुप्लिकेट लाइन्स निकालें?
- 16. सब्लिमे टेक्स्ट 2 के साथ सीएसएस में एक कोलन के बाद अतिरिक्त जगह को कैसे निकालें?
- 17. Websharper के साथ स्टेटिक पेज?
- 18. टेक्स्ट दस्तावेज़ बनाएं (पायथन)
- 19. पायथन: मार्कडाउन स्वरूपित टेक्स्ट को टेक्स्ट
- 20. एंड्रॉइड में EditText के टेक्स्ट ऑनफोकस को कैसे निकालें?
- 21. ऑप्टग्रुप के साथ मल्टीइलेक्स्ट बॉक्स: प्रति समूह
- 22. MySQLdb प्रति कनेक्शन एकाधिक लेनदेन के साथ
- 23. क्या डीजेंगो-पेजिनेशन प्रति पेज एकाधिक पेजिनेशन कर सकता है?
- 24. प्रति पेज लोड केवल एक बार Greasemonkey स्क्रिप्ट चलाएं?
- 25. वर्डप्रेस एडिट पेज स्क्रीन से मुख्य संपादक निकालें
- 26. पायथन की कॉन्फ़िगर पार्सर प्रति अनुभाग
- 27. मोबाइल उपकरणों के लिए टेक्स्ट इनपुट फोकस पर स्क्रॉल पेज?
- 28. एक पायथन स्ट्रिंग में पहला शब्द निकालें?
- 29. पायथन में पथ उपसर्ग को कैसे निकालें?
- 30. जेएसओएन प्रतिक्रिया से सिंगल वैल्यू निकालें पायथन
क्या कोई इस पर विस्तार कर सकता है? मुझे अपने सिर को पीडीएफमिनेर के आसपास लाने में बड़ी परेशानी हो रही है क्योंकि इसमें कोई दस्तावेज नहीं है। – Jazcash
इस कोड के लिए 'pdfminer' का कौन सा संस्करण काम करता है? –
यह वर्तमान * पीडीएफमिनेर * (20140328 लिखने के लेखन के समय) के साथ टूटा हुआ प्रतीत होता है। –