2013-06-18 19 views
7

एचओजी मानव पहचान में लोकप्रिय है। उदाहरण के लिए छवि में कप जैसे वस्तुओं का पता लगाने के लिए इसका उपयोग किया जा सकता है।ओरिएंटेड ग्रेडियेंट्स का हिस्टोग्राम ऑब्जेक्ट डिटेक्शन

प्रोग्रामिंग प्रश्न पूछने के लिए मुझे खेद है, लेकिन मेरा विचार यह है कि अगर मैं वस्तु सुविधाओं को निकालने के लिए हॉग का उपयोग कर सकता हूं तो मुझे यह विचार मिलना चाहिए।

मेरे शोध के अनुसार मुझे कुछ दिनों तक नहीं लगता है, मुझे हां लगता है लेकिन मुझे यकीन नहीं है।

+0

यह आपकी मदद कर सकता है: http://www.geocities.ws/talh_davidc/ – SomethingSomething

उत्तर

29

हां, HOG (Histogram of Oriented Gradients) किसी भी प्रकार की ऑब्जेक्ट्स का पता लगाने के लिए कंप्यूटर के रूप में उपयोग किया जा सकता है, एक छवि पिक्सल का एक गुच्छा है और आप उनकी सामग्री के बावजूद सुविधाओं को निकाल सकते हैं। एक और सवाल, हालांकि, ऐसा करने में इसकी प्रभावशीलता है।

HOG, SIFT, और अन्य ऐसे फीचर एक्स्ट्रेक्टर्स एक छवि से प्रासंगिक जानकारी निकालने के लिए उपयोग किए जाने वाले तरीकों का उपयोग अधिक अर्थपूर्ण तरीके से करने के लिए करते हैं। आप पिक्सल के हजारों (और शायद लाखों) के साथ एक छवि में एक वस्तु या व्यक्ति का पता लगाने चाहते हैं, तो यह बस के रूप में

  1. यह एक ले जाएगा एक मशीन सीखने एल्गोरिथ्म के लिए संख्या के लाखों लोगों के साथ एक सदिश को खिलाने के लिए अक्षम है समय की बड़ी राशि को पूरा करने के
  2. शोर जानकारी (पृष्ठभूमि, कलंक, बिजली और रोटेशन परिवर्तन) जो हम के रूप में महत्वपूर्ण

हॉग एल्गोरिथ्म संबंध नहीं करना चाहते हैं की एक बहुत कुछ नहीं होगा, विशेष रूप से, हिस्टोग्राम बनाता है छवियों में कुछ पैच से एज उन्मुखता के। एक पैच किसी ऑब्जेक्ट, एक व्यक्ति, अर्थहीन पृष्ठभूमि, या किसी अन्य चीज़ से आ सकता है, और किनारे की जानकारी का उपयोग करके किसी क्षेत्र का वर्णन करने का एक तरीका है। जैसा कि पहले उल्लेख किया गया है, इस जानकारी का उपयोग एक मशीन सीखने वाले एल्गोरिदम को शास्त्रीय समर्थन वेक्टर मशीनों को खिलाने के लिए किया जा सकता है ताकि एक प्रकार के ऑब्जेक्ट को दूसरे से अलग करने में सक्षम क्लासिफायर को प्रशिक्षित किया जा सके।

कारण एचओजी को पैदल यात्री पहचान के साथ इतनी सफलता मिली है क्योंकि एक व्यक्ति रंग, कपड़ों और अन्य कारकों में काफी भिन्न हो सकता है, लेकिन पैदल यात्री के सामान्य किनारे अपेक्षाकृत स्थिर रहते हैं, खासकर पैर क्षेत्र के आसपास। इसका मतलब यह नहीं है कि इसका उपयोग अन्य प्रकार की वस्तुओं का पता लगाने के लिए नहीं किया जा सकता है, लेकिन इसकी सफलता आपके विशेष आवेदन के आधार पर भिन्न हो सकती है। The HOG paper विस्तार से दिखाता है कि वर्गीकरण के लिए इन वर्णनकर्ताओं का उपयोग कैसे किया जा सकता है।

यह ध्यान देने योग्य है कि कई अनुप्रयोगों के लिए, एचओजी द्वारा प्राप्त परिणामों को पिरामिड योजना का उपयोग करके काफी सुधार किया जा सकता है। यह निम्नानुसार काम करता है: किसी छवि से एक एकल HOG वेक्टर निकालने के बजाय, आप छवियों (या पैच) को कई उप-छवियों में लगातार विभाजित कर सकते हैं, इन छोटे डिवीजनों में से प्रत्येक को एक व्यक्तिगत HOG वेक्टर से निकालने के लिए। प्रक्रिया फिर दोहराया जा सकता है। अंत में, आप सभी एचओजी वैक्टरों को एक ही वेक्टर में संयोजित करके अंतिम वर्णनकर्ता प्राप्त कर सकते हैं, जैसा कि निम्न छवि में दिखाया गया है।

Pyramidal HOG

यह लाभ यह है कि बड़े पैमाने में हॉग सुविधाओं, और अधिक वैश्विक जानकारी प्रदान करते हैं, जबकि छोटे पैमाने में (है कि छोटे उप विभाजनों में है) वे और अधिक सुक्ष्म विस्तार प्रदान किया है। नुकसान यह है कि अंतिम वर्णनकर्ता वेक्टर बड़ा हो जाता है, इस प्रकार किसी दिए गए वर्गीकृत का उपयोग करके निकालने और प्रशिक्षित करने के लिए अधिक समय लगता है।

संक्षेप में: हाँ, आप उनका उपयोग कर सकते हैं।

संबंधित मुद्दे