मैं ऑडियो के दो टुकड़ों के बीच कुछ प्रकार की दूरी माप प्राप्त करना चाहता हूं। उदाहरण के लिए, मैं जानवर की आवाज़ की तुलना उस जानवर की नकल करने के लिए एक जानवर की आवाज़ की तुलना करना चाहता हूं, और उसके बाद एक आवाज वापस आती है कि आवाज कितनी ही थी।दो ऑडियो अनुक्रमों के बीच अवधारणात्मक समानता
यह एक कठिन समस्या की तरह लगता है। इससे संपर्क करने का सबसे अच्छा तरीका क्या होगा? मैं ऑडियो सिग्नल से कुछ विशेषताओं को निकालने के बारे में सोच रहा था और फिर उन सुविधाओं पर यूक्लिडियन दूरी या कोसाइन समानता (या ऐसा कुछ) करता हूं। ध्वनियों के बीच अवधारणात्मक अंतर निर्धारित करने के लिए निकालने और उपयोगी करने के लिए किस प्रकार की विशेषताओं को आसान बनाना आसान होगा?
(मैंने देखा कि अहजम कैसे हैशिंग का उपयोग करता है, लेकिन यह एक अलग समस्या की तरह लग रहा था क्योंकि शोर के अतिरिक्त ऑडियो के दो टुकड़े बिल्कुल समान हैं। जबकि इस मामले में ऑडियो के दो टुकड़े नहीं हैं वही, वे केवल समान रूप से समान हैं)
धन्यवाद। मैं विभिन्न ध्वनियों के कुछ आवृत्ति स्पेक्ट्रम उत्पन्न करने की कोशिश कर सकता हूं और देख सकता हूं कि समान ध्वनि ध्वनि समान स्पेक्ट्रम उत्पन्न करती है, और अलग-अलग ध्वनियां नहीं होती हैं। विकिपीडिया लिंक के बारे में मुझे क्या समझता है, आवृत्ति स्पेक्ट्रम को फूरियर ट्रांसफॉर्म का उपयोग करके बनाया जाना चाहिए? – Bart