2009-12-05 14 views
6

मुझे बहुत कम उम्र से गहराई से बहरापन है लेकिन सौभाग्य से मैं एक सामान्य व्यक्ति की तरह बात कर सकता हूं। लिप-रीडिंग के साथ भी मेरी अक्षम भाषण मान्यता क्षमताओं के कारण मौखिक संचार हमेशा मेरे लिए मुश्किल रहा है। मैं सिर्फ बोर्ड, पावरपॉइंट स्लाइड्स, किताबें और इंटरनेट पढ़कर स्कूल और कॉलेज से गुजर चुका हूं। मैं अपने वर्तमान सॉफ्टवेयर इंजीनियरिंग नौकरी पर बहुत अच्छा कर रहा हूं, लेकिन देर से मुझे लगता है कि मुझे अपनी स्थिति को बेहतर बनाने के लिए कुछ प्रयास करना होगा।पाठ कनवर्टर को एक अनचाहे भाषण बनाने के बारे में कैसे जाना है?

उपशीर्षक इस देश में टीवी पर फिल्मों/शो को समझने के लिए मेरे जीवनसेवक हैं और मैं केवल पिछले 7 वर्षों से (मैं अब 31 वर्ष) का आनंद ले रहा हूं।

जब भी मैं किसी व्यक्ति से बात करता हूं, यहां तक ​​कि अजनबियों को भी वास्तविक जीवन में उपशीर्षक देखने की क्षमता की दृढ़ता महसूस होती है। मैं पाठ कनवर्टर को एक अनियंत्रित भाषण विकसित करना चाहता हूं, और शुरुआत के रूप में इसे मेरे लिए सटीक शब्दों का भी स्पेल नहीं करना पड़ेगा, केवल अक्षरों/ध्वन्यात्मक संकेतों पर संकेत भी ठीक होंगे।

मैंने थोड़ी देर के लिए इस पर गुमराह किया है, लेकिन अधिकांश परिणाम या तो भाषण के लिए पाठ या भाषण मान्यता पर अर्ध-बेक्ड प्रयास हैं जो कंप्यूटर को वॉयस कमांड देते हैं। मैं वास्तव में इस परियोजना को शुरू करने के तरीके पर कुछ पॉइंटर्स प्राप्त करना चाहता हूं। विशेष रूप से मुझे ऑडियो फ़ाइलों से निपटने के तरीके और लगभग यथासंभव तेज़ी से फोनेटिक्स प्राप्त करने के लिए मुझे किस तरह की प्रसंस्करण करना है, जैसे कदमों की आवश्यकता है।

+1

पहले से ही महान लिंक जोड़े। धन्यवाद दोस्तों। मुझे पहले कुछ सरल कार्यक्रमों को समझना है, फिर एक आईफोन ऐप बनाने के बारे में सोचें ताकि मेरे पास वास्तविक समय बंद कैप्शनिंग टूल हो। लंबे शॉट, लेकिन कोशिश करने लायक है। –

+1

मुझे खुशी है कि हम आपकी मदद कर सकते हैं, जॉय। –

+0

सलाम, महोदय, अपने साहसी जीवन के लिए, और अपने आप को कुछ करने का निर्णय। –

उत्तर

3

आप CMU's Sphinx project पर देखना चाहते हैं जो वास्तविक समय में पाठ को भाषण देता है। इसका प्रयास करने के लिए उनके पास कुछ demos हैं।

+0

इस पर एक कोर्स है: आप यहां अध्ययन करने के लिए कुछ सामग्री प्राप्त कर सकते हैं http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring- 2003/डाउनलोड पाठ्यक्रम-सामग्री / – saurabheights

1

DSP guide पर एक नज़र डालें, यह निम्न स्तर की सामग्री के बारे में अधिक है, लेकिन फूरियर ट्रांसफॉर्म और फ़िल्टरिंग जैसी तकनीकें ऑडियो प्रोसेसिंग के लिए बहुत महत्वपूर्ण हैं। भले ही आप खरोंच से शुरू नहीं करते हैं, फिर भी सिद्धांतों और अनुप्रयोगों की सराहना करना अच्छा हो सकता है।

जिसके अनुसार, मुझे यकीन है शून्य से शुरू, एक कुछ है जो अलग कुछ ही दिनों के काम के साथ लगता है की एक बुनियादी सेट बता सकते हैं बना सकते हैं कि ...

संबंधित मुद्दे