2013-04-21 4 views
7

एक शैक्षणिक परियोजना के लिए हम वर्तमान में मूल गति और इशारा पहचान प्रणाली पर काम कर रहे हैं। हमारा मुख्य लक्ष्य कैमरा स्ट्रीम पर मानव शरीर का पता लगाना है। इस जानकारी का उपयोग करके हम शरीर के मूल कंकाल का पता लगाने के लिए चाहते हैं ताकि व्यक्ति द्वारा किए गए संकेतों का और पता चल सके।ऊपरी बॉडी कंकाल डिटेक्शन

हम अपनी स्ट्रीम को संसाधित करने के लिए EmguCV/OpenCV का उपयोग कर रहे हैं। मुझे यह वीडियो यूट्यूब पर मिला: http://www.youtube.com/watch?v=fYZtmkfWh5g। वह ऊपरी शरीर का पता लगाने में सक्षम है और इसमें एक मूल कंकाल रखता है, लेकिन कैसे? वह इस्तेमाल किए गए किसी भी एल्गोरिदम का उल्लेख नहीं करता है।

हमने पहले से ही पृष्ठभूमि घटाव (BackgroundSubtractorMOG2) का उपयोग करके शरीर समोच्च का पता लगाने की कोशिश की लेकिन कैमरा शोर और बिजली की स्थिति ने हमें असफल कर दिया।

क्या किसी को भी वीडियो में दिखाए गए शरीर को पहचानने का कोई विचार है?

+0

यदि आपकी परियोजना इनडोर है और लोग कैमरे से एक छोटी सी सीमा में खड़े होंगे, तो किनेक्ट का उपयोग करने का प्रयास करें। इसके एसडीके में एक नमूना कोड है जो आप चाहते हैं। –

+0

बस सिर का पता लगाना शुरू करें और फिर कंधे का पता लगाना आसान होगा क्योंकि यह रेटंगल-अनुमानित धड़ की ऊपरी रेखा होगी।मुझे लगता है कि ऊपरी हाथ और निचले हाथ के डिटेक्शन अभी भी आयताकार अनुमान हैं। लेकिन दो पहचानों को अलग करने के लिए, उन्होंने रंग पहचान का भी उपयोग किया। मुझे लगता है कि यही कारण है कि उसने अपनी त्वचा को निचले बाहों में दिखाया। –

उत्तर

1

मुझे लगता है कि आप अगले चरणों का लागू करना चाहिए:

  1. चेहरे का पता लगाने।
  2. हाथों का पता लगाएं।
  3. शरीर छवि का अनुमान लगाएं।
  4. शीर्ष स्थिति जानकारी का उपयोग करते हुए ऊपरी शरीर केनेमेटिक मॉडल (कंकाल) रखें, और इसके पैमाने को यूसुंग का पता लगाया गया आकार निर्धारित करें।
  5. मानव सिर और हाथों की स्थिति से पहले पता लगाए गए मॉडल के सिर और हाथों से मिलान करें।
  6. मानव मुद्रा अनुमान प्राप्त करने के लिए मॉडल के व्यस्त किनेमेटिक्स अपडेट करें।
  7. मुझे लगता है कि यहां कुछ सांख्यिकीय फ़िल्टर, जैसे कि कण फ़िल्टर या काल्मन फ़िल्टर का उपयोग करना बहुत अच्छा होना चाहिए।
  8. जाओ कदम 1.

विज्ञान सम्बन्धी मॉडल के लिए आपको कुछ 2 डी भौतिकी Endine (Box2D उदाहरण के लिए) का उपयोग कर सकते हैं।

0

अधिक जटिल मॉडल, न्यूरलनेटवर्क जैसे कैफे के साथ .. वेबसार्च -> "मानव मुद्रा अनुमान" के माध्यम से पाया जा सकता है, उदाहरण के लिए https://github.com/ZheC/Realtime_Multi-Person_Pose_Estimation नए ओएस पर स्थापित करना आसान नहीं है (पुराने कंपाइलर ...?) और थोड़ा संसाधन भूख (मेरे पुराने पर 1 जीबी-एचडब्ल्यू अब तक नहीं चलेगा) ।

और अंत में यह दिलचस्प हो सकता है, deeplearnjs कैसे बढ़ेगा या अंतःक्रिया हो जाएगा (अब तक इसे क्रोम की आवश्यकता है और नमूने ऑब्जेक्ट मान्यता दिखाते हैं लेकिन आशाजनक लगते हैं)।

संबंधित मुद्दे