मैं जो करना चाहता हूं वह एक एपीआई बनाता है जो मानव भाषण को आईपीए (अंतर्राष्ट्रीय फोनेटिक अल्फाबेट) प्रारूप में अनुवादित करता है। मेरा सवाल यह है कि मूल ऑडियो तरंग के स्तर पर भाषण को डीकोड करने के तरीके कहां हैं। मैंने एक एपीआई की तलाश की, लेकिन जो कुछ मैंने पाया वह सीधे रोमन वर्णमाला में अनुवाद करता है। मैं मुखर फोनेटिक्स को अलग करने की अपनी क्षमता में कुछ और सटीक बनाने की तलाश में हूं।भाषण इनपुट को डीकोड कैसे करें
उत्तर
मैं यह कहकर शुरू करना चाहता हूं कि यह प्रोजेक्ट आपके विचार से कहीं अधिक कठिन और जटिल है। पाठ प्रसंस्करण के लिए भाषण एक बहुत बड़ा और जटिल क्षेत्र है जिसमें बड़ी मात्रा में शोध किया गया है। अधिकांश पार्सर्स सीधे रोमन पात्रों को चीजें भेजते हैं क्योंकि उनकी अधिकांश प्रसंस्करण अस्पष्ट ध्वनियों की संभावनात्मक मिलान है, जो कि अन्य अस्पष्ट ध्वनियों के संदर्भ के साथ है, यह अनुमान लगाने के लिए कि कौन से शब्द एक साथ समझ में आते हैं। आपको ऐसा कुछ ढूंढने की अधिक संभावना है जो आपको आईपीए की बजाए साउंडएक्स देगी। उस ने कहा, यह एक समस्या है जिसे कई मोर्चों पर संपर्क किया गया है। आपकी सबसे अच्छी शर्त शायद सीएमयू से स्फिंक्स परियोजना है।
http://cmusphinx.sourceforge.net/wiki/start
है कि आप एक अच्छी शुरुआत दे देंगे, लेकिन आप एक धारणा है कि पाठ में भाषण प्रसंस्करण बनाने वास्तव में है यह तुलना में बहुत अधिक विकसित है, और वहाँ के साथ तरंग के माध्यम से आईपीए के भाषण का अनुवाद करने का कोई आसान तरीका है किसी भी प्रकार की सटीकता। स्फिंक्स बहुत मॉड्यूलर और पूरी तरह से खुला स्रोत है और इसलिए यह आपको अपनी उंगलियों पर बड़ी मात्रा में बिजली देगा, और उस बिंदु पर आप यह समझ सकते हैं कि यह काम आपके ऊपर कैसे है, लेकिन फिर से। यह किसी भी तरह से हल की गई समस्या नहीं है।
- 1. इनपुट स्ट्रीम को डीकोड करना
- 2. jQuery एचटीएमएल 5 भाषण इनपुट
- 3. google gclids को कैसे डीकोड करें
- 4. आयनक्यूब एन्क्रिप्टेड फ़ाइलों को कैसे डीकोड करें?
- 5. पायथन (2.6) में JSON को डीकोड करने के लिए और यूनिकोड को कैसे डीकोड करें?
- 6. कस्टम भाषण मान्यता सेवा कैसे पंजीकृत करें?
- 7. आईफोन में चीनी भाषण मान्यता कैसे करें
- 8. डब्ल्यूपीएफ टूलटिप को भाषण बबल की तरह कैसे शैलीबद्ध करें?
- 9. इस अजीब जावास्क्रिप्ट को डीकोड करें
- 10. पृष्ठभूमि धागे में छवियों को डीकोड करें?
- 11. यूआरएल में "\ u0026" डीकोड कैसे करें?
- 12. एंड्रॉइड 2.2: एम्यूलेटर में भाषण इनपुट का विकल्प कहां है?
- 13. जावा में http POST डेटा को डीकोड कैसे करें?
- 14. सी में एचटीएमएल इकाइयों को कैसे डीकोड करें?
- 15. सी # का उपयोग कर JSON स्ट्रिंग को डीकोड कैसे करें?
- 16. किसी ईमेल में विषय को डीकोड कैसे करें?
- 17. विंडोज मोबाइल पर यूआरएल एन्कोडिंग स्ट्रिंग को डीकोड कैसे करें?
- 18. php में url को डीकोड कैसे करें जहां url encodeURIComponent()
- 19. STXL.CLUSTD से एसएपी टेक्स्ट को डीकोड कैसे करें?
- 20. पायथन में एक गैर यूनिकोड चरित्र को डीकोड कैसे करें?
- 21. सी # का उपयोग करके वीडियो को एन्कोड/डीकोड कैसे करें?
- 22. एक वेबसाइकिल फ्रेम डीकोड करें
- 23. भाषण मान्यता
- 24. भाषण ORM
- 25. javax.xml.transform.ource को इनपुट इनपुट में कैसे परिवर्तित करें?
- 26. अंतर्निहित भाषण मान्यता आदेश अक्षम करें?
- 27. भाषण मान्यता
- 28. आईफोन में भाषण में पाठ को बदलें
- 29. ओडीबीसी डेटाबेस इनपुट को कैसे व्यवस्थित करें?
- 30. इनपुट प्रकार = टेक्स्ट को अक्षम कैसे करें?
कुछ करने के लायक लगता है, तो। क्या किसी ने दस्तावेज <--> पाठ के लिए उपयोग की जाने वाली मौजूदा विधियों के बारे में क्या बताया है? – josiah
यह सीएमयू स्फिंक्स के तहत बहुत अधिक है, उनके पास प्रयोगों और संशोधनों का एक बहुत व्यापक लॉग है, इसलिए आप न केवल नवीनतम और महानतम के रूप में लागू किए गए कार्यों को देख सकते हैं, लेकिन आप उन सुविधाओं को भी देख सकते हैं जो वे सुविधाओं को खोजने की कोशिश में चल रहे हैं इष्टतम प्रदर्शन। http://sourceforge.net/projects/cmusphinx/forums/forum/5470 –
सुंदर चापलूसी। मैं इस परियोजना की प्रतीक्षा कर रहा हूं। धन्यवाद! – josiah