2012-07-11 22 views
7

मैं तंत्रिका नेटवर्क के साथ अक्षरों और अंकों की सरल पहचान कर रहा हूं। अब तक मैंने नेटवर्क की इनपुट के रूप में पत्र की छवि के प्रत्येक पिक्सेल का उपयोग किया था। यह दृष्टिकोण कहने की जरूरत नहीं है कि यह दृष्टिकोण उन नेटवर्कों का उत्पादन करता है जो बहुत बड़े हैं। इसलिए मैं अपनी छवियों से विशेषताओं को निकालना चाहता हूं और उन्हें एनएनएस में इनपुट के रूप में उपयोग करना चाहता हूं। मेरा पहला सवाल यह है कि पत्रों के गुण उन्हें पहचानने के लिए अच्छे हैं। दूसरा सवाल यह है कि तंत्रिका नेटवर्क में इनपुट के रूप में इन सुविधाओं का प्रतिनिधित्व कैसे करें। उदाहरण के लिए, मैंने पत्रों में सभी कोनों का पता लगाया होगा और उन्हें (x, y) बिंदुओं के वेक्टर के रूप में देखा होगा। इस वेक्टर को एनएन के लिए उपयुक्त कुछ में कैसे बदलें (क्योंकि वेक्टर आकार विभिन्न अक्षरों के लिए अलग हो सकते हैं)।तंत्रिका नेटवर्क से फ़ीचर निष्कर्षण

उत्तर

3

बहुत से लोगों ने ओसीआर के लिए विशेषताओं की किस्में ली हैं। जिनमें से सरलतम है, निश्चित रूप से पिक्सेल मानों को पारित करना।

यूसीआई डेटा सेट से निकाले गए ओपनसीवी नमूने में एक पत्र पहचान डेटा है। यह लगभग 16 विभिन्न सुविधाओं को नियोजित करता है। इस एसओएफ की जांच करें: How to create data fom image like "Letter Image Recognition Dataset" from UCI

आप इसे अपने उत्तर में से एक में समझाते हुए पेपर भी देख सकते हैं। आप इसे गुगल करके प्राप्त कर सकते हैं।

इसके अलावा आपको this PPT में रुचि हो सकती है। यह आजकल इस्तेमाल की जाने वाली विभिन्न फीचर निष्कर्षण तकनीकों का एक संक्षिप्त स्पष्टीकरण देता है।

4

यह आलेख, Introduction to Artificial Intelligence. OCR using Artificial Neural Networks by Kluever (2008) तंत्रिका नेटवर्क का उपयोग कर ओसीआर के लिए 4 विशेषताओं निष्कर्षण तकनीकों का एक सर्वेक्षण देता है। वह निम्नलिखित विधियों का वर्णन करता है:

  • रन लंबाई एन्कोडिंग (आरएलई): आपको इसके लिए एक बाइनरी छवि चाहिए (यानी, केवल सफेद या काला)। बाइनरी स्ट्रिंग को छोटे प्रतिनिधित्व में एन्कोड किया जा सकता है।
  • एज पहचान: किनारों को ढूंढें। आप इसके साथ काफी मोटे हो सकते हैं, इसलिए सटीक (एक्स, वाई) निर्देशांक लौटने की बजाय आप केवल गिनती करके मैट्रिक्स को कम कर सकते हैं यदि कम किनारे पर ऐसा किनारा होता है (यानी, 20%, 40%, 60 & और 80 छवि का%)।
  • 'ट्रू पिक्सेल' की गणना करें: यह छवि मैट्रिक्स के width * height से width + height पर आयाम को कम करता है। आप विभिन्न इनपुट के रूप में width वेक्टर और height वेक्टर का उपयोग करते हैं।
  • बेसिक मैट्रिक्स इनपुट: आपने पहले ही यह कोशिश की है; पूरे मैट्रिक्स को इनपुट करने से अच्छे परिणाम मिलते हैं, लेकिन जैसा कि आपने देखा है, उच्च आयाम और प्रशिक्षण के समय में परिणाम हो सकता है। आप अपनी छवियों के आकार को कम करने के साथ प्रयोग कर सकते हैं (उदाहरण के लिए, 200x200 से 50x50 तक)।
1

यदि आपके पास बहुत उच्च आयामी इनपुट वेक्टर है, तो मेरा सुझाव है कि आप अनावश्यक सुविधाओं को हटाने और सुविधा वेक्टर की आयाम को कम करने के लिए प्रमुख घटक विश्लेषण (पीसीए) लागू करें।

संबंधित मुद्दे