पीपीपीडीएफ विभाजित करने के लिए एक महान पुस्तकालय है, पीडीएफ फाइलों को मर्ज करें। मैं पीडीएफ दस्तावेज़ों को 1 पृष्ठ दस्तावेज़ों में विभाजित करने के लिए इसका उपयोग कर रहा हूं। pyPdf शुद्ध पायथन है और निकाले गए पृष्ठ को सहेजते समय PdfFileWriter ऑब्जेक्ट की _sweepIndirectReferences() विधि में काफी समय बिताता है। मुझे बेहतर प्रदर्शन के साथ कुछ चाहिए। मैंने बहु-थ्रेडिंग का उपयोग करने की कोशिश की है लेकिन चूंकि अधिकांश समय पाइथन कोड में बिताया जाता है क्योंकि जीआईएल (यह वास्तव में धीमी गति से चल रहा था) के कारण कोई गति लाभ नहीं था।फास्ट पीडीएफ स्प्लिटर लाइब्रेरी
क्या सी में कोई लाइब्रेरी लिखी गई है जो समान कार्यक्षमता प्रदान करती है? या किसी के पास प्रदर्शन में सुधार करने के लिए एक अच्छा विचार है (प्रत्येक पीडीएफ फ़ाइल के लिए एक नई प्रक्रिया को बढ़ाने के अलावा, जिसे मैं विभाजित करना चाहता हूं)
अग्रिम धन्यवाद।
फ़ॉलो करें।
- http://multivalent.sourceforge.net/Tools/pdf/Split.html
- http://www.linuxsolutions.fr/how-to-extract-pages-from-a-pdf/
मैं pyPDF PdfWriter वर्ग संशोधित कितना समय खर्च किया गया है का ट्रैक रखने के: कमांड लाइन समाधान के एक जोड़े के लिए लिंक, कि कभी कभी pyPDF तुलना में तेजी से साबित कर सकते हैं _sweepIndirectReferences() विधि पर। यदि यह बहुत लंबा रहा है (अभी मैं 3 सेकंड के जादुई मूल्य का उपयोग करता हूं) तो मैं पाइथन से कॉल करके ghostscript का उपयोग करने के लिए वापस आ जाता हूं।
आपके सभी उत्तरों के लिए धन्यवाद। (कोडेलोगिक का एक्सपीडीएफ संदर्भ वह है जिसने मुझे एक अलग दृष्टिकोण की तलाश की)
मुझे पीडीएफ को अलग करने की आवश्यकता है। अगर मैं सही ढंग से mbtPdfAsm पीडीएफ को इकट्ठा करता हूं। – Nathan
इसका उपयोग पीडीएफ को इकट्ठा करने और अलग करने के लिए किया जा सकता है। – codelogic