2011-09-24 10 views
14

मैं कंप्यूटर दृष्टि पर एक नौसिखिया हूं, लेकिन मुझे पता है कि ओपनसीवी पर कुछ फ़ंक्शंस का उपयोग कैसे करें। मैं दस्तावेज़ पहचान के लिए ओपनसीवी का उपयोग करने की कोशिश कर रहा हूं, मुझे इसके लिए कदम खोजने में मदद चाहिए।ओसीआर के साथ दस्तावेज़ पहचान के लिए ओपनसीवी का उपयोग कैसे करें?

मैं ओपनसीवी उदाहरण find_obj.cpp का उपयोग करने के बारे में सोच रहा हूं, लेकिन दस्तावेज़, उदाहरण के लिए पासपोर्ट में कुछ चर, नाम, जन्मतिथि, चित्र हैं। इसलिए, मुझे इसके लिए चरणों को परिभाषित करने में मदद की ज़रूरत है, और यदि संभव हो तो मुझे चरणों पर कैसे कार्य करना होगा।

मैं एक पूरा कोड नहीं पूछ रहा हूं, लेकिन अगर किसी के पास कोई उदाहरण लिंक है या आप केवल वॉथथ्रू टाइप कर सकते हैं, तो यह बहुत मददगार है।

उत्तर

24

यहां दो बहुत ही अलग कदम शामिल हैं। कोई आपकी वस्तु का पता लगा रहा है, और दूसरा इसका विश्लेषण कर रहा है।

ऑब्जेक्ट का पता लगाने के लिए, आप बस यह पता लगाने की कोशिश कर रहे हैं कि ऑब्जेक्ट फ्रेम में है, और लगभग यह कहां स्थित है। ओपनसीवी फीचर्स फ्रेमवर्क इस के लिए बहुत अच्छा है। कुछ ट्यूटोरियल और व्यापक नमूना कोड के लिए, ओपनसीवी फीचर्स 2 डी ट्यूटोरियल और विशेष रूप से feature matching tutorial देखें।

विश्लेषण के लिए, आपको ऑप्टिकल कैरेक्टर रिकॉग्नाइजेशन (ओसीआर) में खोदने की जरूरत है। ओपनसीवी में ओसीआर पुस्तकालय शामिल नहीं हैं, लेकिन मैं tesseract-ocr की जांच करने की अनुशंसा करता हूं, जो एक महान ओसीआर लाइब्रेरी है। यदि आपके दस्तावेज़ों में एक निश्चित संरचित (टेक्स्ट फ़ील्ड्स का लगातार लेआउट) है तो टेस्सेक्ट-ओसीआर आपको बस चाहिए। अधिक उन्नत विश्लेषण के लिए ocropus देखें, जो टेसेरैक्ट-ओसीआर का उपयोग करता है लेकिन लेआउट विश्लेषण जोड़ता है।

+0

मैं इस समाधान का प्रयास करता हूं, लेकिन अगर मैंने असली दुनिया के उदाहरण पर सफलता हासिल नहीं की है, तो मुझे लगता है कि टेम्पलेट गणित के साथ मुझे केवल एक ही संकल्प के साथ छवि का उपयोग करना होगा। या नहीं? – Ricardo

+1

यदि आपको वास्तविक दुनिया के उदाहरण में परेशानी हो रही है, तो आपको उस विशिष्ट फ़ॉन्ट के लिए टेस्सेक्ट-ओसीआर को प्रशिक्षित करने की आवश्यकता हो सकती है जिसका आप उपयोग कर रहे हैं। अन्यथा यह इसके डिफ़ॉल्ट डेटाबेस का उपयोग करने जा रहा है और यह उस पाठ से मेल नहीं खा सकता है जिसके साथ आप काम कर रहे हैं। टेसरेक्ट-ओसीआर को खिलाने से पहले आप अपना टेक्स्ट स्केल करने का प्रयास कर सकते हैं, मुझे 20 पीएक्स के आसपास अच्छी तरह से ऊंचाई मिलती है। –

+0

क्या आपके पास टेसरेक्ट को प्रशिक्षित करने के तरीके पर एक लिंक है? मुझे अच्छे नतीजे मिलने में परेशानी हो रही है और प्रशिक्षण – Tjorriemorrie

संबंधित मुद्दे