2013-02-25 18 views
8

मैं pdftk के साथ काम करने संकुचित पीडीएफ नाइट्रो रीडर द्वारा बनाई गई धाराओं से जानकारी का निरीक्षण करने के प्रयास कर रहे हैं, लेकिन pdftk धाराओं हवा निकालना नहीं होंगे। यह कोई त्रुटि उत्पन्न नहीं करता है, लेकिन यह पीडीएफ वस्तुओं को पुन: व्यवस्थित करने से परे कुछ भी नहीं प्रतीत होता है। Here इन पीडीएफ में से एक का एक न्यूनतम उदाहरण है।pdftk डेटा को संपीड़ित नहीं होंगे धाराओं

pdftk test.pdf output test-d.pdf uncompress 

जब मैं अन्य पीडीएफ पर पीडीएफटीके का प्रयास करता हूं, तो यह ठीक काम करता प्रतीत होता है। यदि मैं मैन्युअल रूप से डेटा स्ट्रीम निकालता हूं और पायथन में zlib का उपयोग करके उन्हें डिकंप्रेस करता हूं, तो वे ठीक से डिकंप्रेस करते हैं। इसके अलावा, अगर मैं एडोब रीडर में पीडीएफ खोलता हूं और फिर से सहेजता हूं, तो पीडीएफटीके परिणामस्वरूप पीडीएफ पर ठीक काम करता है।

मैं मैन्युअल रूप से मेरी क्षमता के अनुसार नाइट्रो पीडीएफ का निरीक्षण किया है, और यह एक वैध पीडीएफ हो रहा है। मैं इस बारे में बहुत उलझन में हूं कि यहां क्या हो रहा है।

समस्या के लिए पृष्ठभूमि के रूप में, मैं इन pdfs के सैकड़ों है, और मुझे कोई कीवर्ड बहुत है, जो मैं अगर मैं विसंपीड़न स्वचालित कर सकते हैं करने के लिए सक्षम होना चाहिए के लिए खोज कोशिश कर रहा हूँ।

pdftk संस्करण 1.45
विंडोज 7 होम प्रीमियम SP1
नाइट्रो रीडर 2 संस्करण 2.5.0.36

धन्यवाद, जेम्स

उत्तर

2

मैं डेवलपर की ओर से इस प्रश्न का उत्तर प्राप्त किया। यह pdftk के रास्ते में एक बग साबित हुआ /DecodeParms [null] लाइन को संभाला।

यदि डिकोड पैरामीटर शून्य हैं, तो लेखक केवल /DecodeParms लाइन को छोड़ सकता है, लेकिन एक अनुपालन पाठक इसे किसी भी तरह समझना चाहिए। मैंने pdftk के नए संस्करण की कोशिश की और समस्या हल हो रही है।

6

आप pdftk से जुड़ी नहीं कर रहे हैं, तो आप qpdf उपयोग कर सकते हैं। उदाहरण के लिए, आप इसका उपयोग कर सकते हैं:

$ qpdf --stream-data=uncompress input.pdf output.pdf 

ब्लॉब्स होने पर, यदि यह लायक है, तो वे बाइनरी के रूप में दिखाई दे सकते हैं। हालांकि, शेष स्ट्रीम असंपीड़ित होगी (या तो pdftk या qpdf के साथ)। qpdf आपको सभी या केवल स्ट्रीम को असम्पीडित करने की अनुमति देता है।

qpdf मैनुअल से:

जब --stream-डेटा = uncompress निर्दिष्ट किया जाता है, qpdf किसी भी गैर हानिपूर्ण फिल्टर है कि यह समर्थन करता है, को दूर करने का प्रयास करेंगे। यह /FlateDecode,/LZWDecode,/ASCII85Decode, और/ASCIIHexDecode भी शामिल है। यह विभिन्न धाराओं की सामग्री का निरीक्षण करने के लिए बहुत उपयोगी हो सकता है।

pdftk के साथ ऐसा ही हो सकता है।

संबंधित मुद्दे