2015-05-25 11 views
13

यह सवाल इस प्रकार से इनपुट को बाधित करना से OS X Yosemite (10.10) API for continuous speech recognitionओएस एक्स भाषण मान्यता उपयोगिता

OSX अब शानदार निरंतर भाषण मान्यता है। लेकिन यह किसी भी एपीआई का पर्दाफाश नहीं करता है। मैं कस्टम एचसीआई किट का निर्माण कर रहा हूं, और इसे संसाधित करने के लिए मुझे इस भाषण इनपुट को पकड़ने की आवश्यकता है।

इसे कैसे रोकें?

मेरा पहला विचार यह था कि यह कुछ वर्चुअल कीबोर्ड डिवाइस बना सकता है जिसके माध्यम से यह कुंजी-डाउन/की-अप ईवेंट भेजता है। अगर ऐसा होता तो मैं आईओकिट का उपयोग करके रोक सकता था, लेकिन मेरे कीबोर्ड उपकरणों का आकलन करता है, यह प्रकट नहीं होता है। तो यह कुछ उच्च स्तर होना चाहिए।

कृपया ध्यान दें कि मैं 'हैकिंग' टैग जोड़ रहा हूं, क्योंकि ऐसा लगता है कि कोई तैयार रास्ता नहीं है - यह स्पष्ट रूप से कुछ ऐप्पल प्रदान करने का इरादा नहीं रखता है।

संपादित करें:
How to use DictationServices.framework
Can I use OS X 10.8's speech recognition/dictation without a GUI?

+3

"यहाँ ड्रेगन हो," आदि आप के लिए कोशिश कर रहे हैं अवरोध, बिल्कुल? ऑडियो इनपुट? पाठ आउटपुट? यदि उत्तरार्द्ध, क्या आप इसे टेक्स्ट विजेट से नहीं पढ़ सकते हैं? – rhashimoto

उत्तर

2

दुःख की बात है NSSpeechRecognizer केवल आदेशों की एक सरणी के लिए सुनता है (मैं उल्लेख है कि क्योंकि आप इसे अपने लिंक किए गए सवाल में लाया)। मैंने इनपुट को कैप्चर करने के कुछ अलग तरीकों को देखा है लेकिन वे सभी सुंदर यहूदी हैं।

सबसे लोकप्रिय तरीका है "अवरोधन" भाषण ( fn, जब तक कि उपयोगकर्ता यह बदल गया है fn + ) श्रुतलेख आदेश को गति प्रदान और पाठ फ़ील्ड में निर्धारित पाठ दर्ज करने की है। विशेष रूप से एक एचसीआई किट के लिए बिल्कुल सुरुचिपूर्ण नहीं है।

आप प्रफुल्ल महसूस तो कर रहे हैं आप निजी ढांचे, DictationServices पर एक नज़र ले सकता है, लेकिन मानक चेतावनी के सभी लागू होते हैं: App स्टोर अस्वीकृति,

+0

स्टीफ सही है, भले ही आप ओएस एक्स भाषण मान्यता "हैक" करते हैं, आपको शायद ऐप स्टोर इत्यादि के साथ समस्याएं होंगी। ऐसा करने के लिए ओपन-सोर्स फ्रेमवर्क का उपयोग क्यों नहीं करें? उदाहरण के लिए: http://cmusphinx.sourceforge.net/ – Tom

+0

सीएमयूएसफ़िनक्स सभी वाणिज्यिक इंजनों का अंतर्निहित आधार प्रतीत होता है। असल में यह Nuance's Technology का आधार है, और आईआईआरसी ऐप्पल इसका लाइसेंस देता है। लेकिन मूल रूप से इसके वाणिज्यिक संतान के पीछे मूल रूप से महत्वपूर्ण होगा - एक के लिए प्रशिक्षण डेटा की कमी। –

+0

मैं ऐपस्टोर अस्वीकृति से परेशान नहीं हूं क्योंकि मैं अपने स्वयं के उपयोग के लिए एक समाधान की तलाश में हूं। तो शायद 'डिक्टेशन सर्विसेज' है जहां मुझे अगले को देखना चाहिए। एक अदृश्य ओवरले विंडो को अतिरंजित करना संभव हो सकता है जो भाषण डेटा को रोकता है और याद करता है। –

संबंधित मुद्दे