2008-12-11 10 views
6

ओपन सोर्स कार्यान्वयन को प्राथमिकता दी जाएगी।क्या दस्तावेज़ को पीडीएफ से एचटीएमएल में परिवर्तित करने के लिए कोई जावा लाइब्रेरी है?

+3

मैं इसके लिए भी एक समाधान जानना चाहता हूं। पीडीएफबॉक्स ऐसा करने में सक्षम है (http://java.dzone.com/articles/converting-pdf-html-using?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+javalobby%2Ffrontpage+%28Javalobby+%2F+Java+Zone%29), लेकिन बहुत सीमित तरीके से। – Alp

उत्तर

2

जाहिर है, यह एक आसान काम नहीं है, पीडीएफ स्वरूपण एचटीएमएल के एक से अधिक बेहतर है (प्लस आप छवियों को निकालने और उन्हें लिंक करना होगा, आदि)।
सरल पाठ निष्कर्षण बहुत आसान है (हालांकि मामूली नहीं है ...)।
मैं आपके प्रश्न के साइडबार में एक समान प्रश्न देखता हूं: Converting PDF to HTML with Python जो लाइब्रेरी को इंगित करता है (पॉपप्लर, जिसे स्पष्ट रूप से सी ++ में लिखा गया है, शायद जेएनआई/जेएनए के साथ पहुंचा जा सकता है) और संबंधित प्रश्न जो अधिक जवाब प्रदान करता है।

1

केवल जिनके बारे में मुझे पता है उन्हें भुगतान करना होगा।

BFO
JPedal

1

अपाचे नींव से PDFBox का उपयोग करने का प्रयास करें।

संबंधित मुद्दे

 संबंधित मुद्दे