2009-01-21 17 views
17

के तहत अनुपालन की जांच करें मैं एक ऑनलाइन पोर्टल पर काम कर रहा हूं, जहां शोधकर्ता अपने शोध पत्र अपलोड कर सकते हैं। एक आवश्यकता यह है कि सभी पीडीएफ पीडीएफ/ए-प्रारूप में संग्रहीत हैं। चूंकि मैं पीडीएफ/ए अनुरूप दस्तावेजों को उत्पन्न करने के लिए उपयोगकर्ताओं पर भरोसा नहीं कर सकता, मुझे मानक पीडीएफ को पीडीएफ/ए प्रारूप में जांचने और बदलने के लिए एक उपकरण की आवश्यकता है।पीडीएफ/ए में कनवर्ट करें और लिनक्स

आपको पता है कि सबसे अच्छा उपकरण क्या है?

  • मूल्य
  • गुणवत्ता
  • स्पीड
  • उपलब्ध एपीआई

ओपन-सोर्स उपकरण पसंद किया जाएगा, लेकिन एक खोज से कोई भी पता चला। iText पीडीएफ/ए बना सकता है, लेकिन कनवर्ट करना आसान नहीं है, क्योंकि आपको प्रत्येक पृष्ठ को पढ़ना है और इसे एक नए दस्तावेज़ में कॉपी करना है, इस प्रक्रिया में सभी बुकमार्क और एनोटेशन खोना है। (कम से कम जहां तक ​​मुझे पता है, अगर आपको एक आसान समाधान पता है, तो मुझे बताएं)।

एपीआई या तो PHP, जावा या कमांड लाइन-उपकरण के लिए उपलब्ध होना चाहिए। कृपया या तो जीयूआई-केवल या ऑनलाइन-केवल समाधान सूचीबद्ध न करें।

उत्तर

8

मुझे यकीन नहीं है कि आपके सभी लक्ष्य एक ही समय में संतुष्ट हो सकते हैं। पीडीएफ/ए के आसपास की कहानी प्रारूप रूपांतरणों की तुलना में बहुत जटिल है जैसे टिफ से पीएनजी।

  • आधार प्रारूप पीडीएफ 1.4 है: उच्च संस्करण वाले दस्तावेजों के साथ क्या करना है जो उन उच्च संस्करणों से सुविधाओं का उपयोग करते हैं? जानकारी खो जा सकती है।
  • पीडीएफ/ए -1 ए और 1 बी दोनों में, एक्सएमपी/आरडीएफ प्रारूप में मेटाडेटा अनिवार्य है। यदि मूल दस्तावेज़ मेटाडाटा के बिना है, तो आपको इसे से कहीं से प्राप्त करना होगा और इसे जोड़ना होगा। कम से कम iText ऐसा कर सकता है।
  • फोंट एम्बेड करने से सही होने के लिए बहुत सारे विवरण हैं, यह सुनिश्चित करने के लिए कि रिक्त स्थान केवल क्षैतिज आंदोलन आदेशों के बजाय मौजूद हैं।

इसे सब कुछ समेटने के लिए: मुझे लगता है कि आप पीडीएफ के उत्पादकों के अनुपालन के लिए कुछ या सभी ज़िम्मेदारी रखने से बेहतर हैं। बेशक, इसका मतलब यह नहीं है कि आप उनकी मदद नहीं कर सकते: यदि आप समझते हैं कि कौन से टूल्स बहुमत अपने कागजात बनाने के लिए उपयोग करते हैं, तो आप पीडीएफ/ए और विशिष्ट उपकरणों के बारे में दस्तावेज़ीकरण को इंगित कर सकते हैं। (इस तरह के दस्तावेज के एक चरम उदाहरण के रूप में, this पर एक नज़र डालें)

आपके प्रयासों के साथ शुभकामनाएं।

+0

लिंक टूटा हुआ लगता है – castle1971

+0

धन्यवाद, मैंने लिंक तय किया है। –

0

मुझे पीडीएफ/दस्तावेजों के बारे में निश्चित नहीं है, लेकिन आपने जोक कनवर्टर को देखा है? यह आपके लिए कई अलग-अलग प्रारूपों को परिवर्तित कर सकता है, और यह खुला स्रोत है। हम इसे अपने प्रोजेक्ट में काफी व्यापक रूप से उपयोग करते हैं।

http://www.artofsolving.com/opensource/jodconverter

1

Open Office API project अपने लिए क्या देख हो सकता है। 2.4 ओपन ऑफिस पीडीएफ/दस्तावेजों का समर्थन करता है। दस्तावेजों को कन्वर्ट करने के तरीके पर वेबसाइट से code example यहां दिया गया है, यह उदाहरण जावा में है।

3

पहचान भाग के लिए आप Droid tool (डिजिटल रिकॉर्ड ऑब्जेक्ट पहचान) का प्रयास कर सकते हैं, जो Pronom technical registry (जिसमें PDF/A शामिल है) तक पहुंच प्रदान करता है।

8

मैं फ्रांसीसी नेशनल लाइब्रेरी के लिए काम करता था, इस तरह की चीजें करने वाली एक संग्रह प्रणाली बनाने के लिए। दुनिया के शीर्ष दस पुस्तकालयों में से अधिकांश के रूप में, हमने फ़ाइल स्वरूपों को पहचानने के लिए JHOVE का उपयोग किया।

JHOVE बता सकते हैं कि फ़ाइलों को पीडीएफ/ए या नहीं हैं, और यह कर सकते हैं उन्हें भी सत्यापित करें। यह 7 अन्य प्रकार के पीडीएफ भी जानता है, the details देखें।

जोहोव ओपन सोर्स है, इसे जेएसटीओआर और हार्वर्ड यूनिवर्सिटी लाइब्रेरी द्वारा बनाए रखा जाता है। यह use के लिए आसान है।

संबंधित मुद्दे