2010-03-05 7 views
9

मुझे पीडीएफ पढ़ने, कुछ परिवर्तन करने (टीओसी बुकमार्क्स जेनरेट करने) की आवश्यकता है और इसे वापस लिखना है।हास्केल: पार्सिंग पीडीएफ

मैं इस http://hackage.haskell.org/package/HPDF पाया, लेकिन यह केवल पीडीएफ पैदा करने का उल्लेख है, नहीं पार्स (हालांकि मैं इसे याद किया जा सकता था)

हास्केल (स्वयं) शैक्षिक उद्देश्यों के लिए विशुद्ध रूप से चुना जाता है।

+0

इससे पहले कि आप अनुमान लगा सकें कि पीडीएफ पार्सर लिखने में कितना काम शामिल है, आपको सीएचएफ 380 (लगभग £ 243 या $ 353) के लिए आईएसओ स्पेक खरीदना होगा। मुझे संदेह है कि इससे लोगों को दूर रखा जाता है। –

+3

किसी भी तरह यह उदाहरण के लिए रूबी/पर्ल लोगों को रोकने के लिए प्रतीत नहीं होता है। – artemave

+4

आप एडोब की वेबसाइट से पीडीएफ स्पेक की एक मुफ्त कंपनी डाउनलोड कर सकते हैं: http://www.adobe.com/devnet/pdf/pdf_reference.html वे आईएसओ स्पेक का एक अनौपचारिक संस्करण होस्ट करते हैं, लेकिन सामग्री बिल्कुल वही हैं। – Rowan

उत्तर

4

, पीडीएफ हेरफेर के लिए कुछ उपकरणों रहे हैं, हालांकि वे पीढ़ी की दिशा में, बल्कि पार्स करने से पूर्वाग्रह करने लगते हैं:

पांडोक एक महान क्रॉस-मार्कअप लाइब्रेरी है, लेकिन पीडीएफ पार्सिंग का समर्थन नहीं करता है (यह विभिन्न प्रारूपों से पीडीएफ पीढ़ी का समर्थन करता है)।

वहाँ भी है:

मुझे यकीन है कि हम एक है नहीं कर रहा हूँ अच्छा पार्सिंग उपकरण अभी तक।

2

एक सीखने के अभ्यास के रूप में, मैंने हास्केल में एक पीडीएफ पार्सिंग लाइब्रेरी शुरू की, लेकिन यह अपूर्ण है और ध्यान की कमी से थोड़ा सा रहा है। मुझे इसे आपके साथ साझा करने में खुशी होगी, और प्रतिक्रिया, सुधार इत्यादि से प्यार होगा। वर्तमान में यह हैकेज पर होस्ट नहीं किया गया है, लेकिन यदि आप अधूरे कार्यान्वयन के साथ काम करने में रूचि रखते हैं, तो मुझे बताएं और मैं कुछ सहयोगियों से पूछूंगा इसे वहां लाने पर सलाह के लिए।

+0

मैं इस तरह की खोज के लिए बहुत जूनियर हूं। लेकिन वैसे भी धन्यवाद, मैं इसे भविष्य में दिमाग में रखूंगा। – artemave

+0

मुझे आपके साथ काम करने में खुशी होगी।इसकी वर्तमान स्थिति यह है कि यह एक पीडीएफ फ़ाइल लेता है और एक एएसटी जैसी प्रतिनिधित्व करता है, जिसे छेड़छाड़ की जा सकती है। मुझे एक एएसटी सुंदर-प्रिंटर भी मिला है जो वैध पीडीएफ फाइल बनाता है। –

+1

इसके अलावा, मैं "वाह, पीडीएफ आईएसओ स्पेक महंगा है" पर टिप्पणी नहीं कर सकता, लेकिन मुझे यहां मुफ्त दस्तावेज मिले: http://www.adobe.com/devnet/pdf/ मेरे लिए पर्याप्त होना पीडीएफ पार्सिंग की जरूरत है। –

0

चेकआउट pdf-toolbox लाइब्रेरी। पीडीएफ फाइल जेनरेटिंग के लिए यह समर्थन low level है, लेकिन आपके काम के लिए पर्याप्त शक्तिशाली है।

Here एक उदाहरण है कि वृद्धिशील अद्यतन सुविधा का उपयोग कर मौजूदा पीडीएफ फाइल का शीर्षक कैसे बदलें।