मानव आवाज को डिजिटल प्रारूप में कैसे परिवर्तित करें?

मैं एक ऐसे प्रोजेक्ट पर काम कर रहा हूं जहां सिस्टम को सुरक्षित करने के लिए बायोमेट्रिक सिस्टम का उपयोग किया जाता है। हम सिस्टम को सुरक्षित करने के लिए मानव आवाज का उपयोग करने की योजना बना रहे हैं।मानव आवाज को डिजिटल प्रारूप में कैसे परिवर्तित करें?

आइडिया व्यक्ति को कुछ शब्द या वाक्य कहने की अनुमति देना है और सिस्टम उस प्रारूप को डिजिटल प्रारूप में संग्रहीत करेगा। अगली बार जब व्यक्ति सिस्टम में प्रवेश करना चाहता है, तो उसे कुछ ऐसे शब्द बोलना पड़ता है जो पहले इस्तेमाल किए गए शब्दों से अलग हो सकते हैं या नहीं।

हम शब्दों से मेल नहीं खाते हैं, लेकिन मिलान ध्वनि आवृत्ति चाहते हैं।

मैंने इस प्रणाली के बारे में कुछ शोध पत्र पढ़े हैं लेकिन उन कागजात में कोई कार्यान्वयन विवरण नहीं है।

तो बस यह जानना है कि कोई सॉफ्टवेयर/एपीआई है जो एनालॉग आवाज को डिजिटल प्रारूप में परिवर्तित कर सकती है और हमें आवाज की आवृत्ति भी बताएगी।

अब तक मैं सामान्य वेब आधारित अनुप्रयोगों पर काम कर रहा था इसलिए मुझे सामान्य ईपी और प्लेटफार्म जैसे जावा ईई, सी # आदि पता है, लेकिन मुझे इस तरह के आवेदन के बारे में कोई अनुभव नहीं है।

कृपया प्रबुद्ध !!! http://marsyas.info/

यह ऑडियो प्रसंस्करण के लिए एक खुला स्रोत सॉफ्टवेयर ढांचा है:

स्रोत

2011-02-27 Shekhar

बस सोच रहा है कि यह कितना सुरक्षित होगा।किसी की आवाज़ रिकॉर्ड करना और इसे वापस खेलना इतना आसान है! – Matt

अरे, आपको इस प्रश्न का समाधान मिला है? यदि हां आपने यह कैसे किया? वही बात है जो मुझे करना है .. और मुझे कोई विचार नहीं है कि आप मुझे यह कैसे प्राप्त कर सकते हैं। – subodh

यह प्रश्न देखें, http://stackoverflow.com/questions/8724454/java-voice-biometric – subodh

http://www.loquendo.com/en/products/speaker-verification/
http://www.nuance.com/for-business/by-solution/contact-center-customer-care/cccc-solutions-services/verifier/index.htm
(दो लिंक सूचना वायरस सामग्री के कारण निकाल दिया)
http://www.persay.com/products.asp

स्रोत

2011-03-01 08:23:10 abmv

एग्निटियो के उत्पादों को भी देखें: http://agnitio.es/producto.php?id_producto=1 – redent84

क्या एग्निटियो एक परीक्षण संस्करण है जिसे हम परीक्षण कर सकते हैं? – abmv

इस रूप में अच्छा किसी भी रूप में एक प्रारंभिक बिंदु है। उन्होंने परियोजनाओं का एक समूह सूचीबद्ध किया है जिन्होंने विभिन्न रूपों में अपने ढांचे का उपयोग किया है ताकि आप शायद इससे प्रेरणा प्राप्त कर सकें। http://marsyas.info/about/projects। विशेष रूप से Telligence परियोजना को अपनी आवश्यकताओं के सबसे करीब यह के रूप में यह लिंग के लिए इस्तेमाल किया गया था वर्गीकृत ऑडियो लगता है: http://marsyas.info/about/projects#5Teligence

स्रोत

2011-03-01 07:53:32 JohnP

इस एक मेरा मानना है कि जैसे एक परियोजना पर दो चरण हैं:

प्रथम चरण डिजिटल स्वरूप में एक एनालॉग इनपुट से आवाज रिकॉर्ड करने के लिए किया जाएगा (के wav-पीसीएम मान लें)। इसके लिए आप सी # में डायरेक्टशो एपीआई या मानक Wav-In का उपयोग इस प्रोजेक्ट में कर सकते हैं: http://www.codeproject.com/KB/audio-video/cswavrec.aspx। आप बाद में अपनी ऑडियो फ़ाइलों को संपीड़ित करने पर विचार कर सकते हैं, इसके लिए कई विकल्प हैं, विंडोज़ में आप अन्य प्रारूपों के साथ लाइसेंसिंग समस्याओं से बचने के लिए विंडोज मीडिया प्रारूप एसडीके पर विचार कर सकते हैं।

दूसरा चरण एक ध्वनि पहचान ढांचे का निर्माण या उपयोग करना है, यदि आप एक मान्यता फ्रेमवर्क बनाना चाहते हैं तो आपको शायद अपने ध्वनि टुकड़ों के लिए "विशेषताओं" के सेट को परिभाषित करने की आवश्यकता होगी और + पहचान एल्गोरिदम लागू करें। इसके लिए कई अपरिवर्तनीय उपलब्ध हैं, आईईईई एमडी एसीएम.ऑर्ग वेबस्टी आमतौर पर अच्छे स्रोत होते हैं। यदि आप मौजूदा ढांचे का उपयोग करना चाहते हैं तो आप Nuance Recognizer (वाणिज्यिक) या http://cmusphinx.sourceforge.net (ओपन सोर्स) पर विचार करना चाहेंगे।

उम्मीद है कि इससे मदद मिलती है।

स्रोत

2011-03-07 16:27:44 yms

मानव आवाज को डिजिटल प्रारूप में कैसे परिवर्तित करें?

उत्तर

संबंधित मुद्दे