2009-02-03 13 views
5

पीपीपीडीएफ विभाजित करने के लिए एक महान पुस्तकालय है, पीडीएफ फाइलों को मर्ज करें। मैं पीडीएफ दस्तावेज़ों को 1 पृष्ठ दस्तावेज़ों में विभाजित करने के लिए इसका उपयोग कर रहा हूं। pyPdf शुद्ध पायथन है और निकाले गए पृष्ठ को सहेजते समय PdfFileWriter ऑब्जेक्ट की _sweepIndirectReferences() विधि में काफी समय बिताता है। मुझे बेहतर प्रदर्शन के साथ कुछ चाहिए। मैंने बहु-थ्रेडिंग का उपयोग करने की कोशिश की है लेकिन चूंकि अधिकांश समय पाइथन कोड में बिताया जाता है क्योंकि जीआईएल (यह वास्तव में धीमी गति से चल रहा था) के कारण कोई गति लाभ नहीं था।फास्ट पीडीएफ स्प्लिटर लाइब्रेरी

क्या सी में कोई लाइब्रेरी लिखी गई है जो समान कार्यक्षमता प्रदान करती है? या किसी के पास प्रदर्शन में सुधार करने के लिए एक अच्छा विचार है (प्रत्येक पीडीएफ फ़ाइल के लिए एक नई प्रक्रिया को बढ़ाने के अलावा, जिसे मैं विभाजित करना चाहता हूं)

अग्रिम धन्यवाद।

फ़ॉलो करें।

मैं pyPDF PdfWriter वर्ग संशोधित कितना समय खर्च किया गया है का ट्रैक रखने के: कमांड लाइन समाधान के एक जोड़े के लिए लिंक, कि कभी कभी pyPDF तुलना में तेजी से साबित कर सकते हैं _sweepIndirectReferences() विधि पर। यदि यह बहुत लंबा रहा है (अभी मैं 3 सेकंड के जादुई मूल्य का उपयोग करता हूं) तो मैं पाइथन से कॉल करके ghostscript का उपयोग करने के लिए वापस आ जाता हूं।

आपके सभी उत्तरों के लिए धन्यवाद। (कोडेलोगिक का एक्सपीडीएफ संदर्भ वह है जिसने मुझे एक अलग दृष्टिकोण की तलाश की)

उत्तर

3

mbtPdfAsm पीडीएफ प्रसंस्करण के लिए एक तेज़, मुक्त स्रोत कमांड लाइन उपकरण है।

Xpdf यह जीपीएल के बाद से उल्लेखनीय है और सी ++ में लिखा गया है। स्रोत कोड अच्छी तरह से मॉड्यूलरकृत है और कमांड लाइन उपकरण लिखने की अनुमति देता है।

+0

मुझे पीडीएफ को अलग करने की आवश्यकता है। अगर मैं सही ढंग से mbtPdfAsm पीडीएफ को इकट्ठा करता हूं। – Nathan

+0

इसका उपयोग पीडीएफ को इकट्ठा करने और अलग करने के लिए किया जा सकता है। – codelogic

1

पीडीएफएलएटेक्स बहुत सारे पीडीएफ प्रबंधन कर सकता है और बहुत तेज़ है।

मैंने इसे कुछ जटिल लगाव वाले वर्फ्लो के लिए उपयोग किया है। टीएक्स भाषा प्रोग्रामिंग के लिए वास्तव में विदेशी है, लेकिन एक पाइथन लिपि लिखना आसान है जो आवश्यक लाटेक्स लेआउट उत्पन्न करता है और इसे संसाधित करता है।

1

क्या आपने Psyco का उपयोग pyPdf के साथ किया है?

+0

psyco मेरे 64 बिट ubuntu इंस्टॉल पर उपलब्ध नहीं है – Nathan

2

क्या इसे पाइथन होना चाहिए? मेरी शुद्ध-पर्ल लाइब्रेरी CAM::PDF पीडीएफ दस्तावेज़ पृष्ठों को जोड़ने और हटाने में बहुत तेज है। यह जहां संभव हो, बहुत अंत के लिए व्यापक बचाता है।

संबंधित मुद्दे