7

तो हो सकता है कि कोई भी होग सुविधाओं को कैसे निकाला जा सके। विभिन्न उन्मुखीकरणों का उपयोग, प्रति सेल पिक्सल की विभिन्न संख्या और विभिन्न ब्लॉक आकार।होग सुविधाओं की आदर्श संख्या

लेकिन क्या कोई मानक या इष्टतम कॉन्फ़िगरेशन है? मेरे पास 50x100 आकार की प्रशिक्षण छवियां हैं, और मैं अभिविन्यास के 8 दिशाओं का चयन कर रहा हूं। मैं वाहन वर्गीकरण करने के लिए प्रशिक्षण डेटा से सुविधाओं को निकालने जा रहा हूं। लेकिन मैं वास्तव में नहीं जानता कि "इष्टतम" क्या है।

उदाहरण के लिए, मेरे पास 2 कॉन्फ़िगरेशन हैं, क्या किसी दूसरे को चुनने का कोई कारण है? व्यक्तिगत रूप से मुझे लगता है कि दूसरा एक बेहतर विकल्प है, लेकिन क्यों?

enter image description here

enter image description here

उत्तर

7

मैं उत्पाद मान्यता के लिए हॉग का इस्तेमाल किया। उस समय से जो मैंने समझा था, आप मानक HOG की वास्तविक समस्या को इंगित कर रहे हैं। बस कोई इष्टतम विन्यास नहीं है, यह डेटासेट पर निर्भर करता है। यदि आपके पास अपने डेटासेट के लिए इष्टतम मान हैं, और फिर अपने डेटासेट की सभी तस्वीरें का आकार बदलें, तो आपको अपने मूल्यों का आकार बदलना चाहिए। इस प्रकार, HOG के लिए कोई इष्टतम "एक आकार सभी फिट बैठता है" मान नहीं है।

लेकिन सभी खो नहीं गए हैं। इसके बजाय आपको क्या करना चाहिए वह तरीका है जो "हर समय" काम करता है। विचार Spatial Pyramid Matching करना है। यह सिर्फ विभिन्न पैमाने पर HOG कर रहा है और उन्हें एक साथ जोड़ रहा है। एक तस्वीर एक हजार शब्दों के बराबर किया जा रहा है:

From the article

आप देख सकते हैं कि यहाँ, स्तर 2 ठीक कोशिकाओं के साथ सिर्फ मानक हॉग है। लेकिन शायद यह सबसे अच्छा पैमाने नहीं है (क्योंकि कोशिकाएं बहुत छोटी हैं और आप केवल शोर का निरीक्षण करते हैं) (दूसरी तरफ, स्तर 0 की तरह बहुत बड़ी कोशिकाएं बहुत बड़ी हो सकती हैं, और आपके पास हर जगह एक समान हिस्टोग्राम होगा)। जब आप अपने डेटासेट पर प्रशिक्षण करते हैं तो आप प्रत्येक स्तर के लिए सर्वोत्तम वजन की गणना कर सकते हैं, और आपको पता चलेगा कि इष्टतम मूल्य क्या हैं, यानी: सबसे प्रासंगिक सेल आकार

+0

लेकिन ऐसे व्यक्ति के लिए जिसके पास होग सुविधाओं के साथ अनुभव है , क्या आप यह भी मानते हैं कि मैंने जो नीचे की छवि डाली है वह शीर्ष छवि की तुलना में बेहतर होग पैमाने पर है? – user961627

+0

व्यक्तिगत अनुभव से, यदि छवि बहुत छोटी नहीं है, प्रति सेल 8x8 पिक्सेल अक्सर अच्छी कॉन्फ़िगरेशन होती है। और 9 अभिविन्यास - यूओसीटीआई संस्करण। पी एफ Felzenszwalb, आर बी Grishick, डी मैकलेस्टर, और डी रमनान। भेदभावपूर्ण रूप से प्रशिक्षित भाग आधारित मॉडल के साथ ऑब्जेक्ट डिटेक्शन। पामी, 200 9। –

+0

आपका मतलब "बहुत छोटा" है। मुझे लगता है कि 50x100 छवियों को बहुत छोटा नहीं माना जाएगा? – user961627

संबंधित मुद्दे