2009-06-05 17 views
20

पीडीएफ दस्तावेजों कन्वर्ट करने के लिए सबसे अच्छा समाधान HTML के रूप में ब्राउज़र में देखा जा करने के लिए क्या है HTML के लिए? साइट में कई पीडीएफ दस्तावेज हैं और आगंतुक एचटीएमएल के रूप में देखने पर क्लिक कर सकते हैं और इसे स्क्रीन पर एचटीएमएल फाइल के रूप में देखा जाना चाहिए।Convert पीडीएफ

मानक वेबसाइट PHP, Linux, अपाचे चल रही है।

+0

पर एक नज़र आप pdfjs में देखा है हो सकता है तैयार हैं? http://mozilla.github.io/pdf.js/ –

उत्तर

6

pdftohtml ठीक काम करता है: तेज़, स्थिर लेकिन HTML परिणाम सबसे अच्छा है। मैंने इसे एक ऐसी वेबसाइट के लिए काफी समय से उपयोग किया है जिसमें कई नौकरी शुरू हो गई हैं।

हालांकि यह टेक्स्ट सामग्री को निकालने का एक अच्छा समाधान है।

मैं scribd API एक कोशिश

या Google Apps दस्तावेज़ एपीआई देना होगा। गूगल के लिए एक महान काम करता है एक को प्रदर्शित करने और परिवर्तित पीडीएफ फाइलों

+4

वैज्ञानिक कागजात के लिए संरक्षित नहीं करता है, यह अविश्वसनीय लगता है: https://github.com/coolwanglu/pdf2htmlEX – JDonner

+0

@JDonner एक चेतावनी: परिणामी एचटीएमएल कोड अपठनीय है तो आम तौर पर गैर-संपादन योग्य है, और अंतरिक्ष के मेगाबाइट लेता है - कम से कम पीडीएफ के लिए मैं इसे (एक 674.5 किबा पीडीएफ के लिए 2.8 MiB एचटीएमएल) पर परीक्षण किया। यह बड़ा आकार इसे सेवा के लिए विशेष रूप से खराब बनाता है और पढ़ने का एक बुरा अनुभव बनाता है (सुस्त स्क्रॉलिंग इत्यादि)। – Ruslan

+0

@JDonner परिणाम अच्छा दिखता है, लेकिन एचटीएमएल मूल रूप से बेकार है - यह शब्दों को अलग करता है, विभिन्न टैग में प्रत्येक भाग को संलग्न करता है, प्रत्येक आकार (उसी फ़ॉन्ट के) के लिए फोंट निकालता है और उन्हें फ़ाइल को बड़ा बना देता है (जैसा कि रुस्लान ने कहा था)। आप से बेहतर कर रहे हैं एक वार्षिक $ 3000 अमरीकी डालर लाइसेंस के साथ pdf2htmlEX – andrei

4

क्या आपने पीडीएफ डेटा को डेटाबेस में रखने और फिर गतिशील रूप से पीडीएफ या एचटीएमएल पेज बनाने के बारे में विचार किया है जो आगंतुकों का चयन करते हैं?

4

यदि आपके पास अपने होस्टिंग प्रदाता पर कमांड लाइन एक्सेस है, तो poppler_utils पैकेज के अंदर pdftohtml नामक उपयोगिता है।

http://poppler.freedesktop.org/

उपयोग करने के लिए काफी आसान लग रहा है, पीएचपी के अंदर से यह नहीं कहा है, लेकिन यह काम करना चाहिए।

+0

pdftohtml शैली – andrei

1

आप PHP से जावा फोन करने के लिए आप http://www.jpedal.org/html_index.php

+1

हाँ का उपयोग करने से एक PNG छवि को पीडीएफ में परिवर्तित करने ... – Warface