यहां कुछ तरीके हैं जिन पर आप जा सकते हैं - इसमें से बहुत कुछ इस बात पर निर्भर करेगा कि आप मूल पीडीएफ के स्वरूपण (यानी, पैराग्राफ और अन्य लेआउट तत्व) को बनाए रखना चाहते हैं या नहीं।
यदि आप वाणिज्यिक समाधान पर विचार कर रहे हैं, तो हम दो उत्पादों की पेशकश करते हैं जो आपकी आवश्यकताओं को पूरा कर सकते हैं। एक ईज़ीपीडीएफ एसडीके है जिसमें एकल शॉट एक्स्ट्रेक्ट टेक्स्ट() और एक्स्ट्रेक्ट टेक्स्ट 2() कॉल है जो आपके पीडीएफ से टेक्स्ट को सादा पाठ के रूप में खींचती है।
ध्यान दें कि इन कॉलों का आउटपुट बहुत सरल है और आप मूल लेआउट तत्वों को खो देंगे। वे साधारण पाठ निष्कर्षण के लिए अच्छे हैं लेकिन यदि आपके पीडीएफ में टैब्यूलर डेटा होता है तो यह अच्छा नहीं होगा।
यदि आप तालिकाओं से निपट रहे हैं, तो इसके बजाय समृद्ध टेक्स्ट के रूप में इसे खींचने के लिए एक अच्छा विकल्प हो सकता है। हमारे पास एक ऐसा टूल है जिसे EasyConverter SDK नामक व्यवसाय दस्तावेजों के लिए तैयार किया गया है जो केवल एक फ़ंक्शन कॉल का उपयोग करता है।
EasyConverter एसडीके के साथ, आपके मूल पीडीएफ का लेआउट बनाए रखा जाएगा।
दोनों समर्थन सी # इसलिए रुचि रखते हैं तो www.pdfonline.com पर eval संस्करणों को देखने के लिए स्वतंत्र महसूस करें। मैं विक्रेता के लिए काम करता हूं इसलिए इस सुझाव को अपने बच्चे से प्यार करने वाली मां के रूप में लें :-) मैं लंबे समय तक कोड स्निपेट के लिए stackoverflow.com ब्राउज़ कर रहा हूं, लेकिन हाल ही में पोस्टिंग शुरू कर दी है, इसलिए यदि आपके पास है या तो एपीआई के साथ कोई सवाल सिर्फ मुझे बताएं और मैं मदद कर सकता हूं। चीयर्स!
स्रोत
2009-11-02 18:55:24
+1 मुफ्त अच्छा है। –