5

का उपयोग करके इशारा पहचान मैं वर्तमान में एक छिपे हुए मार्कोव मॉडल का उपयोग करके मैटलैब (वेबकैम का उपयोग करके) पर वर्गीकरण चरण के रूप में एक इशारा पहचान अनुप्रयोग पर काम कर रहा हूं। मैंने प्री-प्रसंस्करण भाग पूरा कर लिया है जिसमें फीचर वेक्टर का निष्कर्षण शामिल है। मैंने इन वैक्टरों को प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) लागू किया है।छिपे हुए मार्कोव मॉडल

अब केविन मर्फी के एचएमएम टूलबॉक्स का उपयोग करने के लिए, मुझे अपने अवलोकन अनुक्रम को 1 से एम (एम = अवलोकन प्रतीकों की संख्या) के रूप में संख्याओं (पूर्णांक) के रूप में होना चाहिए। यदि मैं सही हूं तो मुझे अपने अवलोकन अनुक्रम प्राप्त करने के लिए कोडबुक की अवधारणा का उपयोग करना होगा और वेक्टर क्वांटिज़ेशन का उपयोग करना होगा।

मेरे सवालों का:

  1. कैसे मैं एक codebook बनाऊं?
  2. और मैं अपने इनपुट वीडियो के अवलोकन प्रतीकों को प्राप्त करने के लिए इस कोडबुक का उपयोग कैसे करूं?

नोट: मैं आकार सुविधा निकासी के लिए अण्डाकार फूरियर वर्णनकर्ता का उपयोग किया है और प्रत्येक इशारे के लिए पीसीए मूल्यों आयाम [11x220]

(वीडियो = 11 में फ्रेम की संख्या) के एक मैट्रिक्स में जमा हो जाती अब मुझे आगे क्या करना है? क्या एल्लिप्टिकल फूरियर डिस्क्रिप्टर के बजाय फीचर वैक्टर प्राप्त करने का कोई अन्य तरीका है?

उत्तर

2

एक एचएमएम अनुक्रमिक डेटा के लिए संभाव्य मॉडल का एक परिवार है जिसमें आप मानते हैं कि डेटा एक गुप्त-राज्य मार्कोव चेन से एक गुप्त ("छुपा") राज्य स्थान पर उत्पन्न होता है। आम तौर पर, तथाकथित "उत्सर्जन" प्रत्येक राज्य के वितरण के समान परिवार से आते हैं, लेकिन विभिन्न मानकों के साथ।

मैं मैटलैब कार्यान्वयन से विशेष रूप से परिचित नहीं हूं, लेकिन ऐसा लगता है कि आप एक बहुआयामी उत्सर्जन वितरण का उपयोग कर रहे कार्यान्वयन का जिक्र कर रहे हैं, जहां देखा गया डेटा पूर्व-निर्दिष्ट वर्णमाला से प्रतीकों का अनुक्रम है। इस मॉडल में अज्ञात पैरामीटर छिपे हुए राज्यों और प्रत्येक राज्य में प्रत्येक आउटपुट प्रतीक के लिए बहुआयामी भारों के बीच संक्रमण संभावनाएं हैं। यह उचित वितरण है यदि आपकी विशेषताएं द्विआधारी और पारस्परिक रूप से अनन्य हैं - कहें "इशारा बाईं ओर चला गया" बनाम "इशारा दाएं ओर चला गया" या कुछ।

लेकिन यदि आपकी विशेषताएं निरंतर हैं, तो इसके बजाय निरंतर उत्सर्जन वितरण का उपयोग करना अधिक उचित हो सकता है। उदाहरण के लिए, गॉसियन एचएमएम बहुत आम हैं। यहां आपका मनाया गया डेटा निरंतर (संभावित बहुविकल्पीय) डेटा का अनुक्रम है, और धारणा यह है कि प्रत्येक छिपे हुए राज्य में, आउटपुट i.i.d एक गॉसियन से एक मतलब और (सह) भिन्नता है जिसे आप सीखने की उम्मीद करते हैं।

यदि आप पाइथन का विरोध नहीं कर रहे हैं, तो विज्ञान-सीखने वाले पृष्ठ पर बहुमुखी और गॉसियन एचएमएम दोनों के कुछ अच्छे दस्तावेज हैं: http://scikit-learn.org/stable/modules/hmm.html

एक व्यावहारिक परिप्रेक्ष्य से, यदि आप अपने डेटा पर बहुराष्ट्रीय एचएमएम का उपयोग करने के लिए बंधे हैं, तो मैं कोडबुक को पहले चलने वाले के-साधन क्लस्टरिंग का निर्माण करने और फिर एचएमएम में इनपुट के रूप में राज्य लेबल का उपयोग करने का सुझाव दूंगा। लेकिन एक गॉसियन एचएमएम का उपयोग करना बेहतर होगा।

संबंधित मुद्दे