2011-03-03 13 views
6

में कीवर्ड स्पॉटिंग क्या किसी को एक कीवर्ड स्पॉटिंग सिस्टम के बारे में पता है जो स्वतंत्र रूप से उपलब्ध है, और संभवतः एपीआई प्रदान कर रहा है ??स्पीच

CMU स्फिंक्स 4 और एमएस वाक् API भाषण मान्यता इंजन हैं, और KWS के लिए इस्तेमाल नहीं किया जा सकता।

SRI कोई डाउनलोड लिंक, मूल्यांकन के लिए भी नहीं एक कीवर्ड खोलना प्रणाली है, लेकिन। (मुझे उनके सॉफ़्टवेयर के लिए उनसे संपर्क करने के लिए कहीं भी लिंक नहीं मिला)

मुझे एक here मिला लेकिन यह एक डेमो और सीमित है।

उत्तर

3

CMUSphinx pocketsphinx इंजन में कीवर्ड खोलना लागू करता है, जानकारी के लिए देख FAQ entry.

एक भी keyphrase आप "keyphrase खोज" मोड में विकोडक चला सकते हैं पहचान करने के लिए।

कमांड लाइन कोशिश से

: कोड से

pocketsphinx_continuous -infile file.wav -keyphrase “oh mighty computer” -kws_threshold 1e-20 

:

ps_set_keyphrase(ps, "keyphrase_search", "oh mighty computer"); 
ps_set_search(ps, "keyphrase_search); 
ps_start_utt(); 
/* process data */ 

तुम भी हमारे स्रोतों में अजगर और एंड्रॉयड/जावा के लिए उदाहरण मिल सकते हैं। अजगर कोड इस तरह दिखता है, पूर्ण उदाहरण here:

# Process audio chunk by chunk. On keyphrase detected perform action and restart search 
decoder = Decoder(config) 
decoder.start_utt() 
while True: 
    buf = stream.read(1024) 
    if buf: 
     decoder.process_raw(buf, False, False) 
    else: 
     break 
    if decoder.hyp() != None: 
     print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()]) 
     print ("Detected keyphrase, restarting search") 
     decoder.end_utt() 
     decoder.start_utt() 

थ्रेसहोल्ड एक परीक्षण डेटा पर हर keyphrase सही संतुलन प्राप्त करने के लिए के लिए देखते जाना चाहिए detections और झूठे अलार्म याद किया। आप 1e-5 से 1e-50 जैसे मानों का प्रयास कर सकते हैं।

सर्वोत्तम सटीकता के लिए 3-4 अक्षरों के साथ कीफ्रेज़ होना बेहतर है। बहुत छोटे वाक्यांश आसानी से उलझन में हैं।

तुम भी, कई keyphrase के लिए खोज कर सकते हैं इस तरह की एक फ़ाइल keyphrase.list बनाएँ:

oh mighty computer /1e-40/ 
    hello world /1e-30/ 
    other_phrase /other_phrase_threshold/ 

और -kws विन्यास विकल्प के साथ विकोडक में इसका इस्तेमाल करते हैं।

pocketsphinx_continuous -inmic yes -kws keyphrase_list 

यह सुविधा अभी तक sphinx4 डिकोडर में लागू नहीं की गई है।

+0

क्या सीएमयूएसफ़िनक्स का उपयोग किए बिना ऑडियो स्ट्रीम पर कीवर्ड स्पॉटिंग करने के लिए एल्गोरिदम स्पष्टीकरण या लाइब्रेरी है? –

+0

निश्चित रूप से, आप "कीवर्ड स्पॉटिंग" के लिए Google पर जा सकते हैं –

+0

हां बहुत सारे शोध पत्र हैं लेकिन कोई मृत सरल कार्यान्वयन –

संबंधित मुद्दे