2014-07-07 7 views
7

हाय मैं कंप्यूटर विजन के लिए नया हूं। मैं घने सिफ्ट और एचओजी का अध्ययन कर रहा हूं। घने एसआईएफटी के लिए, एल्गोरिदम बस हर बिंदु को रुचि बिंदु के रूप में मानता है और इसके ढाल वेक्टर की गणना करता है। एचओजी ढाल वेक्टर के साथ एक छवि का वर्णन करने का एक और तरीका है।घने SIFT वीएस HOG

मुझे लगता है कि डेंस एसआईएफटी HOG के लिए विशेष मामला है। HOG में, यदि हम बिन आकार को 8 पर सेट करते हैं, तो प्रत्येक विंडो के लिए 4 ब्लॉक होते हैं, प्रत्येक ब्लॉक के लिए 4 कक्ष होते हैं और ब्लॉक स्ट्रॉइड ब्लॉक आकार के समान होता है, हम अभी भी इस विंडो के लिए 128 मंद वेक्टर प्राप्त कर सकते हैं । और हम पूरी छवि का पता लगाने के लिए खिड़की को स्लाइड करने के लिए किसी भी विंडो की तरफ सेट कर सकते हैं। यदि इन दो एल्गोरिदम दोनों की खिड़की की तरफ समान हैं, तो वे समान परिणाम प्राप्त कर सकते हैं।

मुझे यकीन नहीं है कि मैं सही हूं या नहीं। क्या कोई मेरी मदद कर सकता है?

+1

हाय, शैतान है निम्न स्तर के विवरण में मुझे डर है, जैसे इंटरपोलेशन स्कीम और सामान्यीकरण रणनीतियों। विवरण में उनकी तुलना करना वास्तव में मुश्किल है हालांकि पूछने के लिए +1। (मुझे लगता है कि आप वीएलएफईएटी, घने शिफ्ट और हॉग पर अच्छे दस्तावेज़ों से अवगत हैं: http://www.vlfeat.org/) – QED

उत्तर

7

एसआईएफटी डिस्क्रिप्टर 16x16 चुनता है और फिर इसे 4x4 विंडो में विभाजित करता है। इन 4 खिड़कियों में से प्रत्येक पर यह ओरिएंटेड ग्रेडियेंट्स के हिस्टोग्राम की गणना करता है। इस हिस्टोग्राम की गणना करते समय, यह पड़ोसी कोणों के बीच एक इंटरपोलेशन भी करता है। एक बार जब आपके पास सभी 4x4 खिड़कियां हों, तो यह 16x16 ब्लॉक के केंद्र में केन्द्रित आधे खिड़की के आकार का एक गाऊशियन का उपयोग करता है ताकि पूरे 16x16 वर्णक में मूल्यों को वज़न दिया जा सके।

दूसरे हाथ पर होग केवल नाम के अनुसार उन्मुख ग्रेडिएंट के एक साधारण हिस्टोग्राम की गणना करता है।

मुझे लगता है कि एसआईएफटी एक बिंदु के महत्व का वर्णन करने में अधिक उपयुक्त है, क्योंकि गाऊशियन भारोत्तोलन शामिल है, जबकि होग में ऐसी पूर्वाग्रह नहीं है। इस कारण से, (आदर्श) डॉग एसआईएफटी पर छवियों के वर्गीकरण पर होग बेहतर होना चाहिए, यदि सभी फीचर वैक्टर एक विशाल वेक्टर में सम्मिलित होते हैं (यह मेरी राय है, यह सच नहीं हो सकता है)

+1

एचओजी भी कताई में त्रि-रैखिक इंटरपोलेशन का उपयोग करता है, और इसमें एक चालाक सामान्यीकरण योजना है जो जुड़ा हुआ है ब्लॉक की धारणा, और ओवरलैपिंग ब्लॉक के लिए अनुमति देता है, इसलिए हिस्टोग्राम इतना आसान नहीं है। – QED

+0

हां, यहां तक ​​कि होग भी इंटरपोलेशन करता है (शायद यह शिफ्ट की तुलना में अलग तरीके से किया जाता है), मुख्य अंतर गाऊशियन भारोत्तोलन है। सामान्यीकरण प्रत्येक वर्णनकर्ता द्वारा किया जाता है। – Bharat

+0

यदि हां, तो इसका मतलब है कि डेंस सिफ्ट प्रत्येक सेल (या ब्याज बिंदु) के लिए गॉसियन वेटिंग के साथ HOG का एक विशेष मामला है? – user3783676

संबंधित मुद्दे