सबसे पहले मैं यह बताना चाहता हूं कि मेरा प्रश्न आवाज पहचान की "क्लासिक" परिभाषा के बारे में प्रति नहीं है।मैं आईओएस पर दो आवाज नमूने की तुलना कैसे करूं?
क्या हम क्या करने की कोशिश कर रहे हैं, कुछ अलग है के अर्थ में:
- उपयोगकर्ता अपने आदेश रिकॉर्ड
- बाद में, जब उपयोगकर्ता पूर्व दर्ज आदेश बात करेंगे, विशेष प्रकार की गतिविधि हो जाएगा।
उदाहरण के लिए, मैंने अपनी माँ को फोन करने के लिए वॉयस कमांड रिकॉर्ड किया है, इसलिए मैं उसे क्लिक करता हूं और "माँ" कहता हूं। फिर जब मैं प्रोग्राम का उपयोग करता हूं और "माँ" कहता हूं, तो यह स्वचालित रूप से उसे कॉल करेगा।
मैं एक सहेजे गए कमांड नमूने में बोले गए कमांड की तुलना कैसे करूं?
संपादित करें: हमें किसी भी "टेक्स्ट-टू-स्पीच" क्षमताओं की आवश्यकता नहीं है, केवल ध्वनि संकेतों की तुलना करें। स्पष्ट रूप से हम कुछ प्रकार के ऑफ-द-शेल्फ उत्पाद या ढांचे की तलाश में हैं।
आपका प्रश्न क्या है? – titaniumdecoy
जैसा मैंने कहा, मैंने जो पूछा है उसे हासिल करना संभव है :) –
बस इस मुद्दे को साफ़ करने के लिए, हमें किसी भी प्रकार के "टेक्स्ट टू स्पीच" या किसी भी प्रकार की आवश्यकता नहीं है, हम खोज रहे हैं एक अपेक्षाकृत सरल ढांचा जो 2 ध्वनि संकेतों की तुलना कर सकता है और देख सकता है कि वे "समान" हैं या नहीं। इस तरह गैर अंग्रेजी बोलने वाले लोग भी इस कार्यक्रम का उपयोग कर सकते हैं। –