7

में वॉयस डिटेक्शन मैं एक साधारण सी # रीयल-टाइम वॉयस डिटेक्शन लाइब्रेरी की तलाश में हूं। इनपुट एक ऑडियो स्ट्रीम होना चाहिए, और आउटपुट "मानव आवाज" या "मानव आवाज नहीं" होना चाहिए। मुझे भाषण मान्यता या सिग्नल प्रोसेसिंग में कोई ज्ञान नहीं है, और मैं किसी भी तरह की सहायता की सराहना करता हूं।सी #

+3

आप यह निर्धारित करने का इरादा कैसे रखते हैं कि मानव आवाज क्या है और क्या नहीं है? यह एक साधारण समस्या नहीं है, लेकिन यदि आप जो कुछ हासिल करने की कोशिश कर रहे हैं उस पर कुछ पैरामीटर डाल सकते हैं, तो हम एक दिशा का सुझाव दे सकते हैं। – Brad

+0

मैं यह मापने की कोशिश कर रहा हूं कि स्पीकर टॉक कितनी देर तक चलता है, और उसके विराम कितने समय तक हैं। –

+0

ए _similar_ लेकिन समान प्रश्न का उत्तर नहीं दिया गया था [यहां] (http://stackoverflow.com/questions/227140/c-sharp-speech-recognition-is-this-what-the-user-said "), शायद यह जानकारी उपयोगी होगा। – eli

उत्तर

3

"Detecting audio silence in WAV files using C#" के उत्तर पर एक नज़र डालें। मुझे लगता है कि इनपुट एक डब्ल्यूएवी फ़ाइल है। यदि नहीं, तो कृपया ऑडियो स्ट्रीम का प्रारूप प्रदान करें, या यदि आप सीधे माइक्रोफ़ोन से इनपुट लेने का इरादा रखते हैं। यदि आप ऑडियो स्ट्रीम में चुप्पी की मात्रा को माप सकते हैं और आप ऑडियो स्ट्रीम की अवधि जानते हैं तो आप टॉकटाइम की मात्रा की गणना कर सकते हैं। उत्तर में लिंक मृत है, लेकिन यदि आप codeproject.com पर जाते हैं और "सी # वेव फॉर्म" पर खोज करते हैं तो आपको कई परियोजनाओं पर एक हिट मिलेगी जो आपको दिखाती है कि Wav फ़ाइलों को कैसे समझना और कुशल बनाना है। पृष्ठभूमि शोर होने पर मौन का पता लगाना थोड़ा सा व्यक्तिपरक हो सकता है। आपको चुप्पी के लिए न्यूनतम वॉल्यूम थ्रेसहोल्ड लेने की आवश्यकता होगी, जहां इसके नीचे कुछ भी मौन माना जाता है।