CMUSphinx pocketsphinx इंजन में कीवर्ड खोलना लागू करता है, जानकारी के लिए देख FAQ entry.
एक भी keyphrase आप "keyphrase खोज" मोड में विकोडक चला सकते हैं पहचान करने के लिए।
कमांड लाइन कोशिश से
: कोड से
pocketsphinx_continuous -infile file.wav -keyphrase “oh mighty computer” -kws_threshold 1e-20
:
ps_set_keyphrase(ps, "keyphrase_search", "oh mighty computer");
ps_set_search(ps, "keyphrase_search);
ps_start_utt();
/* process data */
तुम भी हमारे स्रोतों में अजगर और एंड्रॉयड/जावा के लिए उदाहरण मिल सकते हैं। अजगर कोड इस तरह दिखता है, पूर्ण उदाहरण here:
# Process audio chunk by chunk. On keyphrase detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
buf = stream.read(1024)
if buf:
decoder.process_raw(buf, False, False)
else:
break
if decoder.hyp() != None:
print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
print ("Detected keyphrase, restarting search")
decoder.end_utt()
decoder.start_utt()
थ्रेसहोल्ड एक परीक्षण डेटा पर हर keyphrase सही संतुलन प्राप्त करने के लिए के लिए देखते जाना चाहिए detections और झूठे अलार्म याद किया। आप 1e-5 से 1e-50 जैसे मानों का प्रयास कर सकते हैं।
सर्वोत्तम सटीकता के लिए 3-4 अक्षरों के साथ कीफ्रेज़ होना बेहतर है। बहुत छोटे वाक्यांश आसानी से उलझन में हैं।
तुम भी, कई keyphrase के लिए खोज कर सकते हैं इस तरह की एक फ़ाइल keyphrase.list बनाएँ:
oh mighty computer /1e-40/
hello world /1e-30/
other_phrase /other_phrase_threshold/
और -kws विन्यास विकल्प के साथ विकोडक में इसका इस्तेमाल करते हैं।
pocketsphinx_continuous -inmic yes -kws keyphrase_list
यह सुविधा अभी तक sphinx4 डिकोडर में लागू नहीं की गई है।
क्या सीएमयूएसफ़िनक्स का उपयोग किए बिना ऑडियो स्ट्रीम पर कीवर्ड स्पॉटिंग करने के लिए एल्गोरिदम स्पष्टीकरण या लाइब्रेरी है? –
निश्चित रूप से, आप "कीवर्ड स्पॉटिंग" के लिए Google पर जा सकते हैं –
हां बहुत सारे शोध पत्र हैं लेकिन कोई मृत सरल कार्यान्वयन –