2011-08-01 12 views

उत्तर

6

मैं ओपनएयर डेवलपर हूं। ओपनएयर केवल बॉक्स से बाहर अंग्रेजी भाषा भाषण मान्यता करता है। पॉकेट्सफिनक्स वितरण में एक मंदारिन ध्वनिक मॉडल है जो ओपनएयर का उपयोग करता है, इसलिए निर्देशों में अंग्रेजी ध्वनिक मॉडल के लिए इसे प्रतिस्थापित करने के लिए संभव हो सकता है, यदि आपके पास एक संगत भाषा मॉडल और ध्वन्यात्मक शब्दकोश बनाने के लिए आपकी अपनी विधि है और आप कुछ आत्म-निर्देशित शोध और परीक्षण करने के लिए तैयार हैं। ध्वनिक मॉडल को tdt_sc_8k कहा जाता है। आप hub4wsj_sc_8k नामक निर्देशों में फ़ोल्डर के बजाय इसका उपयोग करेंगे, लेकिन इसे काम करने के लिए आपको और कुछ करना होगा।

यदि आप इसे आजमा देना चाहते हैं, तो आप ध्वनिक मॉडल, भाषा मॉडल और ध्वन्यात्मक शब्दकोश के बीच संबंधों की स्पष्ट समझ प्राप्त करने के लिए सीएमयू भाषण साइट पर Sphinx project documentation पढ़ना चाहते हैं, और पता लगाना चाहते हैं अपना संगत भाषा मॉडल कैसे बनाएं। आप this page पर फोनेटिक शब्दकोश के साथ एक मास्टर डिक्शनरी के रूप में शुरू करने में सक्षम हो सकते हैं, जिससे आप छोटे आईफोन आकार के फोनेटिक शब्दकोश और बाद में भाषा मॉडल बना सकते हैं, क्योंकि यह ध्वनिक मॉडल के साथ संभवतः संगत है। उस पृष्ठ पर भाषा मॉडल OpenEars के लिए बहुत बड़ा है। परीक्षण के लिए मैं शायद लगभग 100 शब्दों का एक कमांड और नियंत्रण मॉडल बनाउंगा। आप शब्दों के एक कॉर्पस से भाषा मॉडल बनाने के लिए Sphinx Knowledge Base Tool का उपयोग करने में सक्षम होना चाहिए जिसे आपने पहले ही फोनेटिक शब्दकोश बना दिया है।

अगला चरण आपके ध्वनिक मॉडल, भाषा मॉडल और फोनेटिक शब्दकोश को सत्यापित करना होगा जैसा कि पारंपरिक पॉकेट्सफिनक्स इंस्टॉलेशन में काम कर रहा है, उदाहरण के लिए लिनक्स पर। यदि आपको इसके साथ अच्छे नतीजे मिलते हैं, तो आप ओपनएयर फोरम पर आ सकते हैं और मैं इसे ओपनएर्स में काम करने में मदद करने की कोशिश करूंगा (वहां कोई गारंटी नहीं है क्योंकि ध्वनिक मॉडल परीक्षण का हिस्सा नहीं रहा है, लेकिन मैं भी ' एक विशेष कारण के बारे में सोचें कि यह काम नहीं करेगा)। OpenEars 'LanguageModelGenerator क्लास निश्चित रूप से केवल अंग्रेज़ी के साथ काम करेगा। यह सुनिश्चित करने के लिए आप ज़िम्मेदार हैं कि ध्वनिक मॉडल को ऐसे तरीके से लाइसेंस प्राप्त किया गया है जो इसे ऐप स्टोर ऐप में इस्तेमाल करने से नहीं रोकता है, अगर आप अपनी परियोजना को वितरित करने की योजना बना रहे हैं।

शुभकामनाएं!

संपादित करें: मैं इस अद्यतन आप जानते हैं कि मंदारिन ध्वनिक मॉडल अब OpenEarsExtras का हिस्सा है यह बताने के लिए है, और कहना है कि LanguageModelGenerator अब अद्यतन किया गया है, ताकि आप इसके बारे में एक मनमाना मास्टर ध्वन्यात्मक शब्दकोश दे सकते हैं करना चाहते थे अपने विकल्प अगर आपके पास सही स्वरूपण वाला एक है (यानी, शब्द के बाद एक फोन के बाद फोनेम के बाद एक लाइन ब्रेक, वर्णमालाकृत) जिसके बाद गतिशील भाषा मॉडलर का उपयोग अंग्रेजी के अलावा अन्य भाषाओं के साथ करना आसान बनाना चाहिए यदि आप पहले से ही एक ध्वनिक मॉडल है।

जिस तरह से इसे काम करना चाहिए, यह है कि आपके पास उस भाषा में एक लुकअप डिक्शनरी है जो cmu07a.dic के समान है जो डिफ़ॉल्ट अंग्रेजी लुकअप डिक्शनरी है, और LanguageModelGenerator बाकी को संभालती है, इसलिए इसके बारे में मेरा बयान यदि आपके पास एक ध्वन्यात्मक शब्दकोश है जो उच्चारण से देखा जा सकता है, तो कई कदम और अनुसंधान अनिवार्य रूप से मामला नहीं होना चाहिए। अभ्यास में आपके लिए यह कैसे काम करता है इस पर प्रतिक्रिया OpenEars forum पर बहुत सराहना की जाएगी (कृपया स्टैक ओवरफ़्लो पर प्रतिक्रिया या बग रिपोर्ट न दें)।

+0

आपके अपडेट के लिए धन्यवाद। OpenEarsExtras में मैंने एक mandarin_notone.dic देखा, तो क्या इसका मतलब यह है कि यह चीनी उच्चारण के विभिन्न स्वरों का पता नहीं लगा सकता है? – CodePlumber

संबंधित मुद्दे