2017-08-21 18 views
6

से प्रासंगिक जानकारी निकालने के लिए कैसे मैं Opencv, Tesseract और केरास के संयोजन का उपयोग करके विभिन्न रसीदों की एक श्रृंखला से जानकारी निकालने का प्रयास कर रहा हूं। प्रोजेक्ट का अंतिम परिणाम यह है कि मुझे फोन का उपयोग करके रसीद की तस्वीर लेने में सक्षम होना चाहिए और उस तस्वीर से स्टोर का नाम, भुगतान प्रकार (कार्ड या नकद), भुगतान की गई राशि और निविदा बदलें।प्राप्ति

अब तक मैं अलग नमूना ऐसी पृष्ठभूमि, denoising को दूर करने और निम्नलिखित जैसे एक द्विआधारी छवि को बदलने और एक छवि के साथ छोड़ दिया हूँ के रूप में OpenCV का उपयोग कर प्राप्तियों की एक श्रृंखला पर कुछ अलग preprocessing चरणों किया है:

receipt-scanned

मैं रसीद पर ओसीआर करने के लिए टेस्सेक्ट का उपयोग कर रहा हूं और परिणामों को एक टेक्स्ट फ़ाइल में लिख सकता हूं। मैंने एक स्वीकार्य स्तर पर प्रदर्शन करने के लिए ओसीआर प्राप्त करने में कामयाब रहा है, इसलिए मैं वर्तमान में रसीद की एक तस्वीर ले सकता हूं और अपना प्रोग्राम चला सकता हूं और मुझे रसीद पर सभी पाठ वाली टेक्स्ट फ़ाइल मिल जाएगी।

मेरी समस्या यह है कि मैं रसीद पर सभी पाठ नहीं चाहता हूं, मुझे बस कुछ जानकारी चाहिए जैसे ऊपर सूचीबद्ध पैरामीटर। मैं इस बात के बारे में अनिश्चित हूं कि मुझे ऐसे मॉडल को प्रशिक्षित करने के बारे में कैसे जाना है जो मुझे आवश्यक डेटा निकालेगा।

क्या मैं सोचने में सही हूं कि मुझे छवि के विभिन्न वर्गों को विभाजित करने और वर्गीकृत करने के लिए केरा का उपयोग करना चाहिए, और उसके बाद पाठ को उस अनुभाग में फ़ाइल करने के लिए लिखना चाहिए जिसे मेरे मॉडल ने प्रासंगिक डेटा के रूप में वर्गीकृत किया है? या क्या मुझे क्या करना है इसके लिए एक बेहतर समाधान है?

क्षमा करें अगर यह एक बेवकूफ सवाल है, तो यह मेरा पहला ओपनसीवी/मशीन लर्निंग प्रोजेक्ट है और मैं अपनी गहराई से काफी दूर हूं। किसी भी रचनात्मक आलोचना की सराहना की जाएगी।

+0

से संबंधित प्रासंगिक जानकारी को साफ़/निकालने के लिए उपयोग कर सकते हैं, आप जानकारी पुनर्प्राप्त करने के लिए तंत्रिका नेटवर्क का उपयोग क्यों करना चाहते हैं? आपके पास पहले से ही टेक्स्ट है - वांछित शब्द/शर्तें/मान प्राप्त करने के लिए आप बस कुछ टेक्स्टफिल्टरिंग/प्रोसेसिंग क्यों नहीं कर सकते? – petezurich

+0

मुझे लगता है कि मुझे यहां एक तंत्रिका नेट का उपयोग करना चाहिए क्योंकि रसीद किस स्टोर से है, इस पर निर्भर करता है कि पाठ पूरी तरह अलग हो सकता है - उदाहरण के लिए। कुछ स्टोर "राशि निविदा" कह सकते हैं जबकि दूसरा भुगतान की गई राशि को दर्शाने के लिए "नकद" कहेंगे। चूंकि यह रसीद से रसीद तक ​​किसी भी मानक मानक के साथ बदल सकता है, मैं इस धारणा के तहत था कि परंपरागत फ़िल्टरिंग का उपयोग करके समस्या का समाधान नहीं किया जा सका, क्योंकि मेरे लिए हार्ड कोड में किसी भी विशेष मूल्य के लिए बहुत से संभावित शर्तें हैं। –

उत्तर

0

छवि का उपयोग करने का यह एक अच्छा विचार है, क्योंकि आप दस्तावेज़ की संरचना को खो देंगे यदि आप केवल ओसीआर को सादा करते हैं। मुझे लगता है कि आप सही रास्ते पर हैं। मैं बिल को हेडर, कुल राशि, लाइन आइटम में विभाजित करता हूं और उस पर प्रशिक्षित एक छवि वर्गीकरण प्राप्त करता हूं। फिर आप इसे

+0

क्या आपके पास छवि वर्गीकरण बनाने के लिए पर्याप्त डेटा है? – vumaasha

संबंधित मुद्दे