से गैर-भाषण, गैर-संगीत ध्वनि की रीयल-टाइम पहचान, मैं एक विशेष ध्वनि, जैसे कार दरवाजा स्लैमिंग, या शायद एक टोस्टर निकालने टोस्ट के अनुरूप घटनाओं को लॉग करना चाहता हूं।निरंतर माइक्रोफ़ोन स्ट्रीम
सिस्टम को "जोरदार शोर डिटेक्टर" से अधिक परिष्कृत होना चाहिए; इसे अन्य जोरदार शोर से उस विशिष्ट ध्वनि को अलग करने में सक्षम होना चाहिए।
पहचान शून्य-विलंबता की आवश्यकता नहीं है, लेकिन प्रोसेसर को हमेशा माइक्रोफ़ोन से आने वाले डेटा की निरंतर स्ट्रीम के साथ बनाए रखने की आवश्यकता होती है।
- इस कार्य में काफी भाषण मान्यता व्यवस्था से अलग है, या मैं भाषण मान्यता पुस्तकालयों/उपकरणकिटें का उपयोग कर सकता इन गैर भाषण ध्वनियों की पहचान के लिए?
- आवश्यकता को देखते हुए मुझे केवल एक ध्वनि से मिलान करने की आवश्यकता है (ध्वनि की लाइब्रेरी के बीच मिलान करने के विपरीत), क्या कोई विशेष अनुकूलन मैं कर सकता हूं?
This answer इंगित करता है कि एक मिलान किया फिल्टर उपयुक्त होगा, लेकिन मैं विवरण पर धुंधला कर रहा हूँ। मुझे विश्वास नहीं है कि लक्ष्य ध्वनि में बदलाव के कारण लक्ष्य ध्वनि के नमूने के बीच ऑडियो तरंग डेटा पर एक सरल क्रॉस-सहसंबंध और माइक्रोफ़ोन स्ट्रीम प्रभावी होगी।
मेरा प्रश्न this के समान भी है, जिस पर अधिक ध्यान नहीं दिया गया।
से संबंधित आप http://dsp.stackexchange.com पर बेहतर किस्मत से अधिक हो सकता है के रूप में मान्यता प्राप्त है। – mtrw