में इन-डॉक्यूमेंट लिंक जोड़ें मुझे कई (सैकड़ों) पीडीएफ दस्तावेजों का प्रोग्रामेटिक विश्लेषण और गठबंधन करने की ज़रूरत है, और पृष्ठों को विशेष तरीकों से एक साथ जोड़ना है। प्रत्येक पीडीएफ में प्रत्येक स्थान पर टेक्स्ट शामिल होता है जहां एक लिंक संबंधित होता है, यह दर्शाता है कि इसे किस लिंक से लिंक करना चाहिए। मैं स्थान और टेक्स्ट निकालने के लिए pdfminer
का उपयोग कर रहा हूं जहां लिंक होना चाहिए; अब मुझे वास्तव में उन लिंक बनाने की जरूरत है।पीडीएफ
मैंने कुछ शोध किया है और निष्कर्ष निकाला है कि PyPDF2
ऐसा माना जा सकता है। किसी भी दर पर, एक प्रतीत होता है-सीधा addLink
विधि जो काम पूरा करने का दावा करती है। मैं इसे काम करने के लिए नहीं मिल सकता है।
from PyPDF2 import PdfFileWriter
from PyPDF2.pdf import RectangleObject
out = PdfFileWriter()
out.insertBlankPage(800, 1000)
out.insertBlankPage(800, 1000)
# rect = [400, 400, 600, 600] # This doesn't seem to work either
rect = RectangleObject([400, 400, 600, 600])
out.addLink(0, 1, rect) # link from first to second page
with open(r'C:\temp\test.pdf', 'wb') as outf:
out.write(outf)
ऊपर दिया गया कोड एक सुंदर दो-पेज पीडीएफ उत्पन्न करता है जिसमें कम से कम जहां तक मैं कह सकता हूं। क्या वहां कोई भी जानता है कि यह कैसे पूरा किया जा सकता है? या कम से कम एक संकेत जहां मैं गलत जा रहा हूँ?
एक समाधान को पीईपीडीएफ 2 का उपयोग करने की आवश्यकता नहीं है, जब तक लाइब्रेरी स्वतंत्र रूप से लाइसेंस प्राप्त हो। कड़ाई से बोलते हुए, पायथन भी एक आवश्यकता नहीं है, लेकिन यह मेरी वर्तमान संरचना में फिट करने के लिए अच्छा होगा, बिना किसी दूसरी भाषा को हैक किए।