2012-03-06 10 views
6

का उपयोग करके दो बुकमार्क के बीच पाठ निकालना मैं पीडीएफ दस्तावेज़ को पढ़ने के लिए अपाचे पीडीएफबॉक्स का उपयोग कर रहा हूं जिसमें बुकमार्क द्वारा परिभाषित पदानुक्रम है। पदानुक्रम केवल पेड़ के स्तर पर सामग्री के साथ एक पेड़ के रूप में है।अपाचे पीडीएफबॉक्स

निम्नलिखित कोड का उपयोग कर दो पत्ती स्तर बुकमार्क के बीच टेक्स्ट उद्धृत किया:

Stripper.setStartBookmark(), 
Stripper.setEndBookmark(), 
Stripper.writeText()), 

रिटर्न के बजाय पूरे पृष्ठ में पाठ। संक्षेप में, मेरी समस्या this thread में उल्लिखित है।

क्या दो बुकमार्क के बीच सामग्री निकालने का कोई तरीका है?

यदि हां, तो मेरे कोड में क्या परिवर्तन होना चाहिए?

+0

@Shiram मैं एक ही सवाल है:

यहाँ एक बुकमार्क कि स्थान डेटा शामिल हैं का एक उदाहरण है। अगर आप पहले से ही इसे – Kasun

+0

निकाल चुके हैं तो जवाब पोस्ट करें क्या आपको कोई समाधान मिला? यदि नहीं, तो आपके पास बुकमार्क का उदाहरण है (उदाहरण के लिए, एक्सएमएल प्रारूप में)। – maffo

उत्तर

0

मुझे अनुमान है कि आपके बुकमार्क में सही डेटा नहीं है।

यह बुकमार्क प्रयोग कर रहे हैं केवल पेज की ओर इशारा करते है की तरह लगता है जहां आपकी सामग्री, शुरू होता है बल्कि पृष्ठ पर एक स्थान से।

<Title Action="GoTo" Style="bold" Page="2 FitH 518"> 
Title Name 
</Title> 
+0

पीडीएफबॉक्स में, बुकमार्क्स को बुकमार्क से विशिष्ट GoTo कार्रवाइयों के परिणामस्वरूप, PDPageXYZDestination के लिए हल किया जाता है। इसलिए, वे वास्तव में पृष्ठ में एक पूर्ण स्थिति को इंगित करते हैं, जो मेरे पीडीएफ व्यूअर में सत्यापित है, जहां सीधे अनुभाग में बुकमार्क स्क्रॉल पर क्लिक करना है। – nickb