मैंने एमएफसीसी और छुपे हुए मार्कोव मॉडल का उपयोग करके ध्वनि पहचान के लिए अवधारणा प्रणाली का सबूत विकसित किया है। जब मैं ज्ञात ध्वनियों पर सिस्टम का परीक्षण करता हूं तो यह आशाजनक परिणाम देता है। यद्यपि सिस्टम, जब किसी अज्ञात ध्वनि को इनपुट किया जाता है तो परिणाम निकटतम मैच के साथ आता है और स्कोर यह नहीं है कि यह एक अज्ञात ध्वनि है:छिपे हुए मार्कोव मॉडल थ्रेसहोल्डिंग
मैंने भाषण के लिए 3 छुपे हुए मार्कोव मॉडल को प्रशिक्षित किया है, एक के लिए पानी की नल से पानी आ रहा है और एक मेज पर दस्तक देने के लिए। तब मैं उन्हें अनदेखी डेटा पर परीक्षण करने और निम्नलिखित परिणाम प्राप्त:
input: speech
HMM\knocking: -1213.8911146444477
HMM\speech: -617.8735676792728
HMM\watertap: -1504.4735097322673
So highest score speech which is correct
input: watertap
HMM\knocking: -3715.7246152783955
HMM\speech: -4302.67960438553
HMM\watertap: -1965.6149147201534
So highest score watertap which is correct
input: knocking
HMM\filler -806.7248912250212
HMM\knocking: -756.4428782636676
HMM\speech: -1201.686687761133
HMM\watertap: -3025.181144273698
So highest score knocking which is correct
input: unknown
HMM\knocking: -4369.1702184688975
HMM\speech: -5090.37122832872
HMM\watertap: -7717.501505674925
यहाँ इनपुट एक अज्ञात आवाज़ है लेकिन यह अभी भी सबसे निकटतम मिलान रिटर्न के रूप में वहाँ थ्रेशोल्डिंग/कचरा छानने के लिए कोई प्रणाली है।
मुझे पता है कि एक ओओवी (शब्दावली से बाहर) को स्पॉट करने वाले कीवर्ड में कचरा या भराव मॉडल का उपयोग करके फ़िल्टर किया जा सकता है लेकिन यह कहता है कि इसे अज्ञात शब्दों के एक सीमित सेट का उपयोग करके प्रशिक्षित किया जाता है जहां यह मेरे लिए लागू नहीं किया जा सकता सिस्टम क्योंकि मैं उन सभी ध्वनियों को नहीं जानता जो सिस्टम रिकॉर्ड कर सकते हैं।
भाषण मान्यता प्रणाली में ऐसी ही समस्या हल हो गई है? और झूठी सकारात्मक से बचने के लिए मैं अपनी समस्या का समाधान कैसे कर सकता हूं?
मुझे लगता है कि इसे क्रॉस मान्य में स्थानांतरित किया जाना चाहिए। – ziggystar
मैं मानता हूं कि यह क्रॉस मान्य के अधिक (और बेहतर योग्य) ध्यान प्राप्त करेगा। अफसोस की बात है, बल्ले सिग्नल (उर्फ "पर्याप्त पर्याप्त अनुमतियों के साथ पर्याप्त आंखों") को बंद कर दिया जाता है, इसलिए राडेक को इसे वहां रखना होगा। ("पर निर्भर" में सीवी के लिए कोई विकल्प नहीं है या मैन्युअल रूप से निर्दिष्ट है कि यह कहां से संबंधित है। मेह।) – Godeke