2012-02-28 29 views
7

पर जावा ओसीआर एपीआई ओपन-सोर्स ओसीआर सामान की कुछ भी समझ में नहीं आता है। मुझे एक्स्प्से में आयात करने के लिए .jar प्राप्त करने के लिए बस (यदि यह भी संभव है) प्राप्त करने के लिए मुझे एक छवि (.bmp, .tiff, .jpeg) इनपुट के लिए एक छवि (.bmp, .tiff, .jpeg) दे सकती है और यह मुझे छवि की टेक्स्ट सामग्री के साथ एक स्ट्रिंग आउटपुट करता है। यह कैप्चा या हस्तलेख नहीं है, कुछ अक्षरों की एक साधारण "फोटो" है।एक्वाइसे

ओपन-सोर्स समाधान की सराहना की जाती है। मैं Tess4j या JavaOCR जैसी परियोजनाओं देखा था, लेकिन वे थोड़ा :(

किसी को भी एक सुझाव है संभाल करने के लिए जटिल हो जाते हैं

अद्यतन:?। मैंने पाया कि AspriseOCR उपयोग करने के लिए बहुत आसान है बस .jar करने के लिए आयात निर्माण पथ और एक विधि बुलाओ। काफी अच्छा! लेकिन ... मैं इसे अपनी परियोजनाओं पर उपयोग नहीं कर सकता! क्या आप किसी लाइब्रेरी को Asprise के रूप में सरल जानते हैं (मुझे कुछ भी संकलित करने की आवश्यकता नहीं है, या किसी भी प्रकार का है प्रशिक्षण:। सिर्फ आयात और बस हो गया !!)

+0

इसे जांचें: http://stackoverflow.com/questions/1813881/java-ocr-implementation और यह http://asprise.com/product/ocr/index.php?lang=java – Favonius

+0

1) क्यों 'खुला' स्रोत? क्या आप सुझाव दे रहे हैं कि कोई भी जो "ओसीआर सामानों के कुछ भी नहीं समझता" * लाभदायक रूप से कोड में परिवर्तन या एक्सटेंशन कर सकता है? या आप वास्तव में 'मुक्त' मतलब है? 2) 'जावा' में केवल एक ऊपरी केस अक्षर होता है, यह एक संक्षिप्त नाम है, जिसका नाम 'जावा' लिखा जाएगा 3) कृपया 'ग्रीटिंग्स एन' जैसे शोर को छोड़ दें। –

+2

आपके उत्तर के लिए धन्यवाद। 1) ओपन सोर्स सिर्फ इसलिए है क्योंकि पुस्तकालय खरीदने के लिए मेरे पास कोई पैसा नहीं है! मैं कोड में कोई विस्तार नहीं करना चाहता, लेकिन मैं इसे अपने मोबाइल ऐप में से किसी एक पर उपयोग कर सकता हूं। 2) मेरे पास अंग्रेजी में "मातृभाषा" नहीं है, इसलिए मैं कुछ गलतियों को कर सकता हूं, क्षमा करें। 3) मैं हमेशा विनम्र होने की कोशिश करता हूं :) – nunoaac

उत्तर

9

जहां तक ​​मैं पता है कि मूल देशी जावास्क्रिप्ट जावा ओसीआर एसडीके नहीं हैं। जावा एपीआई हैं जो मूल इंटरफेस के लिए कॉल लपेटती हैं, उदाहरण के लिए, सबसे लोकप्रिय ओपनसोर्स ओसीआर इंजनों में से एक के लिए - टेस्सेरैक्ट (http://groups.google.com/group/tesseract-ocr/) - कुछ जावा रैपर जैसे टेस्जेरक्ट (http://code.google.com/p/tesjeract/) या टेस 4 जे (http://tess4j.sf.net/) हैं। यह आपके लिए काम कर सकता है, लेकिन इसे स्थापित करना मुश्किल है और आपके पक्ष में छवि-प्रीप्रोकैसिंग और फ़ॉन्ट प्रशिक्षण विकसित करने की आवश्यकता होगी।

एक और समाधान क्लाउड सेवा हो सकता है। इसके लिए इंटरनेट कनेक्शन रखने के लिए एंड-यूजर एप्लिकेशन की आवश्यकता होती है, लेकिन यह आपकी प्रोग्रामिंग भाषा पसंद और संसाधन सीमाओं से स्वतंत्र है। http://ocrsdk.com पर एक नज़र डालें, यह क्लाउड-आधारित ओसीआर एसडीके है जो आपको वेब एपीआई के माध्यम से एक छवि अपलोड करने देता है और आपको ओसीआरएड डेटा देता है। यह वेब एपीआई आधारित ओसीआर एसडीके मुफ़्त नहीं है, जो आपके लिए उपयुक्त नहीं हो सकता है, लेकिन मैं अभी भी अनुशंसा करता हूं कि आप इसे आज़माएं (इसमें नि: शुल्क परीक्षण है) क्योंकि इसकी कीमत एंटरप्राइज़ समाधान के मुकाबले वास्तव में किफायती है जबकि यह उद्यम-स्तर प्रदान करती है ओसीआर सटीकता जो ओपन सोर्स से बेहतर है। आप github पर यह Java codesample भी उपयोगी पा सकते हैं। अस्वीकरण: मैं @ ABBYY काम करता हूं।

+0

क्या ABBYY हमें ओसीआरएड डेटा प्राप्त करने के लिए पीडीएफ फ़ाइल (जो स्कैन किया गया दस्तावेज़ हो सकता है) अपलोड करने की अनुमति देता है? – Dax