के लिए जटिल छवि तैयार करें मैं क्रेडिट कार्ड से अंकों को पहचानना चाहता हूं। चीजों को और खराब करने के लिए, स्रोत छवि को उच्च गुणवत्ता की गारंटी नहीं है। ओसीआर को एक तंत्रिका नेटवर्क के माध्यम से महसूस किया जाना चाहिए, लेकिन यह यहां विषय नहीं होना चाहिए।ओसीआर
वर्तमान समस्या छवि प्रीप्रोकैसिंग है। चूंकि क्रेडिट कार्ड में पृष्ठभूमि और अन्य जटिल ग्राफिक्स हो सकते हैं, इसलिए पाठ एक दस्तावेज़ स्कैन करने के समान स्पष्ट नहीं है। मैंने एज डिटेक्शन (कैनी एज, सोबेल) के साथ प्रयोग किए, लेकिन यह सफल नहीं था। ग्रेस्केल छवि और धुंधला हुआ एक (जैसा कि Remove background color in image processing for OCR पर बताया गया है) के बीच अंतर की गणना भी एक ओसीआरबल परिणाम नहीं पहुंचा।
मुझे लगता है कि अधिकांश दृष्टिकोण विफल हो जाते हैं क्योंकि एक विशिष्ट अंक और इसकी पृष्ठभूमि के बीच का अंतर पर्याप्त मजबूत नहीं है। संभवतः ब्लॉक में छवि का विभाजन करने की आवश्यकता है और प्रत्येक ब्लॉक के लिए सबसे अच्छा प्रीप्रोकैसिंग समाधान ढूंढना है?
क्या आपके पास कोई सुझाव है कि स्रोत को एक पठनीय बाइनरी छवि में कैसे परिवर्तित किया जाए? किनारे का पता लगाने का रास्ता है या क्या मुझे मूल रंग थ्रेसहोल्डिंग के साथ चिपकना चाहिए?
मूल छवि:
ग्रेस्केल छवि:
यहाँ एक ग्रेस्केल-थ्रेशोल्डिंग दृष्टिकोण (जहां मैं स्पष्ट रूप से परिणाम से खुश नहीं हूँ) का एक नमूना है
थ्रेसहोल्ड छवि :
किसी भी सलाह के लिए धन्यवाद, वैलेन्टिन
चूंकि बहुत कम विपरीत हैं, इसलिए मैंने बताया कि मैं किनारे का पता लगाने की कोशिश करता हूं। –