बिट्रैप के प्रत्येक पिक्सेल को सीधे एक तंत्रिका नेटवर्क में खिलाकर बहुत सारे प्रशिक्षण की आवश्यकता होगी, और छवि के स्केलिंग या रोटेशन को संभालने के लिए अच्छा काम नहीं करेगा।
तंत्रिका नेटवर्क को अच्छी वर्गीकरण करने में मदद करने के लिए, आपको कुछ प्रीप्रोसेसिंग चरणों को करने की आवश्यकता है।
- छवि सामान्यीकृत करें:
- ताकि छवि के हिस्टोग्राम एक संदर्भ छवि से मेल खाता है कंट्रास्ट और चमक को समायोजित करें।
- शोर को हटाने के लिए छवि को धुंधला करें।
- इसे कुछ थ्रेसहोल्ड का उपयोग करके काले & सफेद में परिवर्तित करें।
- आकार के बाध्यकारी बॉक्स को ढूंढें, एक पूर्वनिर्धारित आकार के पैमाने पर।
- की गणना छवि है कि एक-दूसरे अंकों अंतर करने के लिए इस्तेमाल किया जा सकता की विभिन्न सुविधाओं:
- छवि — की Euler number है कि कितने "छेद" आकार में (उदाहरण के लिए दो छेद देखते हैं अंक 8 के लिए)।
- सफेद पिक्सेल की संख्या (अंकों के क्षेत्र)
- सफेद पिक्सल — के निर्देशांक के सेट की principal components आपको बताता है कि "लंबाई" आकार है।
- ... अन्य विशेषताएं जो आप सोच सकते हैं कि समान अंकों के समान मान हैं।
प्रमुख घटक भी आकार के रोटेशन को सामान्य बनाने, ताकि लंबे समय तक अक्ष खड़ी है इस्तेमाल किया जा सकता।
विशेषताएं आप वर्गीकरण के लिए तंत्रिका नेटवर्क में फ़ीड करते हैं, पिक्सेल नहीं।
मैंने वास्तव में एक समान कार्य करने के लिए तंत्रिका नेटवर्क का उपयोग करने की कोशिश की है, और मैंने पाया (अब तक) यह बेहतर काम करता है अगर मैं गणना करने और नेटवर्क को उन गणनाओं को देने के बजाय नेटवर्क पर वास्तविक पिक्सल देता हूं।अनुमोदित, मैंने इनपुट के रूप में अच्छी गणना नहीं की हो सकती है। लेकिन अब तक यह उनके बिना दृढ़ता से काम करता है कि छवि सामान्य रूप से पर्याप्त सामान्य है। – Phil