2010-11-30 9 views
7

मैं एक स्पष्टीकरण/एपीआई दस्तावेज़/उदाहरण के लिए कैसे उपयोग कर रहा हूं (और ट्रेन?) सी ++ में टेस्सेरैक्ट, Google टेस्सेक्टैक्ट पेज पर कुछ भी उपयोगी नहीं है, और फिर भी वेब पर कुछ ढूंढना है ।टेस्सेरैक्ट या कोई अन्य ओसीआर lib

कोई भी उपयोगी स्रोत, अनुभव स्वागत से अधिक होगा, क्योंकि मुझे नहीं पता कि इसके साथ कैसे शुरुआत करें।

पी.एस:

  1. मैं अन्य पुस्तकालयों पर सुझाव के लिए खुला रहा हूँ। http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract जहां का चयन करना होगा Tesseract का कौन सा संस्करण करना चाहते हैं:
  2. केवल मुफ्त पुस्तकालयों

उत्तर

4

मैं Tesseract ... 'प्रशिक्षण Tesseract' का एक सरल गूगल के साथ कुछ अनुभव है इस पेज का पता चलता है ट्रेन .. जबकि 3 नवीनतम संस्करण है, यह बिल्कुल नया है और इस प्रकार लोग अभी भी किसी भी मुद्दे को इस्त्री कर रहे हैं - मैं अभी भी संस्करण 2.4 का उपयोग कर रहा हूं। वैसे भी, आप देखेंगे कि एक विशेष 'भाषा' (या 'फोंट' या 'चरित्र-सेट' कहा जाना चाहिए) के लिए प्रशिक्षण टेसरेक्ट में लगभग 9 कदम हैं। आप मौजूदा 'eng' भाषा का भी उपयोग कर सकते हैं - लेकिन यह आपके आवेदन पर निर्भर करता है। उदाहरण के लिए, मेरे आवेदन में मुझे दस्तावेज़ विश्लेषण करना होगा और एक विशेष क्षेत्र लेना होगा और संख्याओं की 13-वर्ण वाली स्ट्रिंग को ओसीआर करना चाहते हैं - और मुझे उच्च सटीकता की आवश्यकता थी - और मैं नहीं चाहता था कि यह '5' को ' एस 'और' 0 'के रूप में' ओ 'इत्यादि, इसलिए यह मेरे विशेष फ़ॉन्ट-सेट की एक विशेष' भाषा 'बनाने के लिए तार्किक था, जिसमें केवल अक्षर 0.9 शामिल थे, जबकि आपको अतिरिक्त' शोर 'होने पर परवाह नहीं है

+0

धन्यवाद, कोई विचार जहां मुझे सी ++ के लिए ट्यूटोरियल/एपीआई दस्तावेज़ मिलते हैं? – snoofkin

0

टेस्सेक्टैक्ट ओसीआर ऑप्टिकल कैरेक्टर का पता लगाने के लिए एक ओपन सोर्स लाइब्रेरी है। यदि आप विजुअल स्टूडियो का उपयोग कर रहे हैं तो आपको पुस्तकालय फ़ाइलों को शामिल करने की आवश्यकता है। यदि आप क्यूटी निर्माता का उपयोग कर रहे हैं तो आपको क्यूटी पर काम करने के लिए लाइब्रेरी बनाना होगा। लाइब्रेरी बनाने के लिए आपको सीएमकेलिस्ट या सीमेक गुई का उपयोग करने की आवश्यकता है। आप लिंक Opencv Ocr build for Qt 5.4 mingw

संबंधित मुद्दे