मैं माइक्रोसॉफ्ट के भाषण पहचानकर्ता का उपयोग कर एक छोटे अभ्यास ऐप पर काम कर रहा हूं। मुझे लगता है कि मैं जो कर रहा हूं उसके लिए पर्याप्त तेज़ शब्दों को पहचानने के लिए मुझे लगता है। मैं सामान्य रूप से बात करने में सक्षम होना चाहता हूं और सिस्टम जो मैं कह रहा हूं उससे "कीवर्ड" लेगा और एक स्ट्रिंग का उत्पादन करूंगा। वर्तमान में मैं 5 शब्दों के कस्टम व्याकरण का उपयोग कर रहा हूं। लाल, नीला, पीला, हरा, ऑरेंज। उदाहरण के लिए यदि मैं लाल नीला पीला कहता हूं। इंजन "लाल" पकड़ लेगा और शेष शून्य में चला जाएगा।माइक्रोसॉफ्ट स्पीच रिकग्निशन स्पीड
मैं निम्नलिखित का उपयोग कर की कोशिश की है:
sr.RecognizeAsync(RecognizeMode.Single)
फिर AudioState के बाद एकल मोड में पुन: इसे रीसेट परिवर्तन करने के लिए "बंद कर दिया।" यह अगले शब्द को पकड़ने के लिए पर्याप्त तेज़ नहीं है। विचार?
RecognizerAudioPosition के संयोजन के साथ मैं उन परिणामों को प्राप्त करने में सक्षम था जो मैं ढूंढ रहा था। आपका बहुत बहुत धन्यवाद! –
@ जोश आर ग्लेड मदद की खुशी –
क्या आप दिखा सकते हैं कि आपको यह काम करने के लिए कैसे मिला? मुझे एक ही समस्या है। –