8

मैं एक ऐसे प्रोजेक्ट पर काम कर रहा हूं जहां सिस्टम को सुरक्षित करने के लिए बायोमेट्रिक सिस्टम का उपयोग किया जाता है। हम सिस्टम को सुरक्षित करने के लिए मानव आवाज का उपयोग करने की योजना बना रहे हैं।मानव आवाज को डिजिटल प्रारूप में कैसे परिवर्तित करें?

आइडिया व्यक्ति को कुछ शब्द या वाक्य कहने की अनुमति देना है और सिस्टम उस प्रारूप को डिजिटल प्रारूप में संग्रहीत करेगा। अगली बार जब व्यक्ति सिस्टम में प्रवेश करना चाहता है, तो उसे कुछ ऐसे शब्द बोलना पड़ता है जो पहले इस्तेमाल किए गए शब्दों से अलग हो सकते हैं या नहीं।

हम शब्दों से मेल नहीं खाते हैं, लेकिन मिलान ध्वनि आवृत्ति चाहते हैं।

मैंने इस प्रणाली के बारे में कुछ शोध पत्र पढ़े हैं लेकिन उन कागजात में कोई कार्यान्वयन विवरण नहीं है।

तो बस यह जानना है कि कोई सॉफ्टवेयर/एपीआई है जो एनालॉग आवाज को डिजिटल प्रारूप में परिवर्तित कर सकती है और हमें आवाज की आवृत्ति भी बताएगी।

अब तक मैं सामान्य वेब आधारित अनुप्रयोगों पर काम कर रहा था इसलिए मुझे सामान्य ईपी और प्लेटफार्म जैसे जावा ईई, सी # आदि पता है, लेकिन मुझे इस तरह के आवेदन के बारे में कोई अनुभव नहीं है।

कृपया प्रबुद्ध !!! http://marsyas.info/

यह ऑडियो प्रसंस्करण के लिए एक खुला स्रोत सॉफ्टवेयर ढांचा है:

+0

बस सोच रहा है कि यह कितना सुरक्षित होगा।किसी की आवाज़ रिकॉर्ड करना और इसे वापस खेलना इतना आसान है! – Matt

+0

अरे, आपको इस प्रश्न का समाधान मिला है? यदि हां आपने यह कैसे किया? वही बात है जो मुझे करना है .. और मुझे कोई विचार नहीं है कि आप मुझे यह कैसे प्राप्त कर सकते हैं। – subodh

+0

यह प्रश्न देखें, http://stackoverflow.com/questions/8724454/java-voice-biometric – subodh

उत्तर

1
+0

एग्निटियो के उत्पादों को भी देखें: http://agnitio.es/producto.php?id_producto=1 – redent84

+0

क्या एग्निटियो एक परीक्षण संस्करण है जिसे हम परीक्षण कर सकते हैं? – abmv

2

इस रूप में अच्छा किसी भी रूप में एक प्रारंभिक बिंदु है। उन्होंने परियोजनाओं का एक समूह सूचीबद्ध किया है जिन्होंने विभिन्न रूपों में अपने ढांचे का उपयोग किया है ताकि आप शायद इससे प्रेरणा प्राप्त कर सकें। http://marsyas.info/about/projects। विशेष रूप से Telligence परियोजना को अपनी आवश्यकताओं के सबसे करीब यह के रूप में यह लिंग के लिए इस्तेमाल किया गया था वर्गीकृत ऑडियो लगता है: http://marsyas.info/about/projects#5Teligence

2

इस एक मेरा मानना ​​है कि जैसे एक परियोजना पर दो चरण हैं:

प्रथम चरण डिजिटल स्वरूप में एक एनालॉग इनपुट से आवाज रिकॉर्ड करने के लिए किया जाएगा (के wav-पीसीएम मान लें)। इसके लिए आप सी # में डायरेक्टशो एपीआई या मानक Wav-In का उपयोग इस प्रोजेक्ट में कर सकते हैं: http://www.codeproject.com/KB/audio-video/cswavrec.aspx। आप बाद में अपनी ऑडियो फ़ाइलों को संपीड़ित करने पर विचार कर सकते हैं, इसके लिए कई विकल्प हैं, विंडोज़ में आप अन्य प्रारूपों के साथ लाइसेंसिंग समस्याओं से बचने के लिए विंडोज मीडिया प्रारूप एसडीके पर विचार कर सकते हैं।

दूसरा चरण एक ध्वनि पहचान ढांचे का निर्माण या उपयोग करना है, यदि आप एक मान्यता फ्रेमवर्क बनाना चाहते हैं तो आपको शायद अपने ध्वनि टुकड़ों के लिए "विशेषताओं" के सेट को परिभाषित करने की आवश्यकता होगी और + पहचान एल्गोरिदम लागू करें। इसके लिए कई अपरिवर्तनीय उपलब्ध हैं, आईईईई एमडी एसीएम.ऑर्ग वेबस्टी आमतौर पर अच्छे स्रोत होते हैं। यदि आप मौजूदा ढांचे का उपयोग करना चाहते हैं तो आप Nuance Recognizer (वाणिज्यिक) या http://cmusphinx.sourceforge.net (ओपन सोर्स) पर विचार करना चाहेंगे।

उम्मीद है कि इससे मदद मिलती है।

संबंधित मुद्दे