2012-12-29 18 views
6

रीयल-टाइम जरूरी नहीं है, हालांकि मैं अपने अंतिम वर्ष प्रोजेक्ट के लिए एक गेम बना रहा हूं और मैं केवल संगीत ट्रैक पर आधारित गतिशील स्तर बनाने के लिए ऑडियो की शक्ति का उपयोग करना चाहता हूं। मेरा उद्देश्य प्लेस्टेशन मोबाइल और सी # का उपयोग कर पीएस वीटा के लिए यह गेम बनाना है, लेकिन अगर मैं चाहता हूं कि मैं सी ++ और पीएसपी पर स्विच कर सकूं।ऑडियो फ़ाइल से वास्तविक समय प्रतिक्रिया बनाने के लिए ऑडियो विश्लेषण लाइब्रेरी की आवश्यकता है?

मैं एक डब्ल्यूएवी फ़ाइल का उपयोग कर सकता हूं, और उम्मीद है कि वेवफॉर्म के आयाम को निकालने के साथ-साथ एक स्तर बनाने के लिए इस डेटा से औसत आवृत्ति और अनुमानित बीपीएम जैसी अन्य विशेषताओं की गणना भी कर सकते हैं।

मेरे पास इस कच्चे डेटा के साथ काम करने की कोशिश करने के बारे में कोई योग्यता नहीं है, मैं सिर्फ यह जानना चाहता हूं कि मैं वास्तव में उस जानकारी को प्राप्त कर सकता हूं। यदि मैं नमूने निकाल सकता हूं और इन नमूनों की विभिन्न विशेषताओं का दावा कर सकता हूं, तो मैं उन्हें स्टोर कर सकता हूं और नोट्स आदि बनाने के लिए जोर से, पिच और अधिक में परिवर्तन कर सकता हूं।

मैं सी # का उपयोग कर रहा हूं, लेकिन यदि संभव हो तो मैं या तो पी/इनवॉक का उपयोग करें या मेरी प्रोजेक्ट को किसी अन्य डिवाइस पर स्विच करें जो सी # के बजाय सी ++ का उपयोग करता है।

मैं थोड़ा सा घबरा रहा हूं, क्योंकि मैं वास्तव में थोड़ा सा स्टंप हूं।

बहुत धन्यवाद दोस्तों।

उत्तर

3

जिस समस्या का आप यहां वर्णन करते हैं वह संगीत/ऑडियो सुविधा निष्कर्षण में से एक है और अकादमिक कार्य का एक बड़ा निकाय मौजूद है जिसे आप आकर्षित कर सकते हैं। कला का एक और उपयोगी शब्द जिसमें खोजना है संगीत सूचना पुनर्प्राप्ति (एमआईआर)

शोधकर्ताओं ने रिकॉर्डिंग से पुनर्प्राप्त करने का प्रयास करने वाली 'विशेषताओं' की सूची बड़ी और विविध है, जैसे कि 'ऊर्जा' जैसी भावनात्मक विशेषताओं के माध्यम से पिच और कुंजी जैसी निर्धारित चीजों से।

इनमें से अधिकतर आप कल्पना कर सकते हैं उससे अधिक कठिन हो जाते हैं, और आमतौर पर केवल 60-70% सटीक - हालांकि आपकी आवश्यकताओं के लिए, यह शायद पर्याप्त है।

एक अच्छा प्रवेश बिंदु Sonic Visualiser डाउनलोड किया जा सकता है, जिसके लिए बड़ी संख्या में फीचर निष्कर्षण प्लग-इन मौजूद हैं, और ओपन-सोर्स हैं। आपको कम से कम एक महसूस हो जाएगा कि क्या संभव है।

अद्यतन: कला का एक अन्य उपयोगी शब्द ऑफ़सेट पहचान - यह आमतौर पर बीट पहचान एल्गोरिदम का वर्णन करने के लिए उपयोग किया जाता है।

4

दुर्भाग्य से मुझे नहीं लगता कि आप ऐसा करने के लिए सी # का उपयोग करने में सक्षम होंगे - AFAIK, इसके लिए कोई भी जेआईटी कंपाइलर नहीं है। मुझे मोनो के लिए कुछ पढ़ने के बारे में याद है, जो इसे सी # के साथ उपयोग करने के लिए उपलब्ध कराएगा, लेकिन मुझे अभी यकीन नहीं है।

उसने कहा - मैं सी ++ के साथ जाऊंगा। यदि आप इस तरह से जाते हैं, तो आप सीएलएएम (http://clam-project.org/) जैसे विशाल ऑडियो विश्लेषण पुस्तकालयों का उपयोग कर सकते हैं।

घबराओ मत (बड़ी, दोस्ताना पत्रों की कल्पना करें।) चरण-दर-चरण परियोजना के लिए आवश्यक हिस्सों की कल्पना करें, एक-एक करके निपटें, और आप किसी भी समय नहीं किया जाएगा। =)

1

Aubio एक सी/सी ++ लाइब्रेरी है जो अन्य चीजों के साथ पिच ट्रैकिंग, ऑफ़सेट पहचान और बीपीएम ट्रैकिंग करता है।

"तरंग के आयाम को निकालने" के लिए, तरंग आयाम है, यानी।, आप प्रत्येक एन नमूने के सबसे बड़े पूर्ण मूल्य के साथ ऑडियो नमूना चुन सकते हैं और विज़ुअलाइज़ेशन के "आयाम" भाग को करने के लिए उस मान का उपयोग कर सकते हैं।

Here's some code जो आपको सी # में WAVE डेटा पढ़ने शुरू करने में मदद कर सकता है।

Here's some informationFFTW लाइब्रेरी के लिए एक सी # रैपर लिखने के बारे में।

संबंधित मुद्दे