में उपयोग के लिए * .wav फ़ाइल से आयाम सूची निकालने में मुझे थोड़ा सा प्रोग्रामिंग और रूपांतरण समस्या है। मैं उपकरणों द्वारा खेले गए नोटों को पहचानने के लिए एआई डिजाइन कर रहा हूं और एक लहर फ़ाइल से कच्चे ध्वनि डेटा निकालने की आवश्यकता है। मेरा उद्देश्य एआई द्वारा उपयोग के लिए फाइल में समय के साथ एफएफटी ऑपरेशन करना है। इसके लिए मुझे ऑडियो फ़ाइल की आयाम सूची की आवश्यकता है, लेकिन मुझे एक रूपांतरण तकनीक नहीं मिल रही है जो काम करेगी। फ़ाइलें एमपी 3 के रूप में शुरू होती हैं और फिर मैं उन्हें WAV फ़ाइल में परिवर्तित करता हूं, लेकिन मैं हमेशा एक संपीड़ित फ़ाइल के साथ समाप्त होता हूं जो इसे पढ़ने की कोशिश करते समय गड़बड़ कर देता है। क्या किसी को पता है कि मैं WAV फ़ाइल को किसी ऐसे चीज़ में कैसे परिवर्तित कर सकता हूं जो पाइथन के तरंग मॉड्यूल के साथ संगत होगा या यहां तक कि कुछ ऐसा जो डेटा को सीधे आयाम सूची में परिवर्तित करेगा?पायथन
पायथन
उत्तर
डिफ़ॉल्ट पायथन तरंग मॉड्यूल बहुत अच्छी तरह से नहीं है। आप एक विकल्प के रूप में scipy में शामिल एक कोशिश कर सकते हैं।
की जाँच करें: Reading *.wav files in Python
आप ऑडियो के साथ किसी भी संख्यात्मक बड़े कार्य करने करने के लिए जा रहे हैं, scipy आपका सबसे अच्छा विकल्प वैसे भी हो सकता है।
मेरा मानना है कि पाइथन .dat फ़ाइलों को पढ़ सकता है। "- वाम amp - समय सही amp" आप .dat फ़ाइलें कि बस का एक पाठ सूची रहे हैं में MP3 या wavs या जो कुछ भी चालू करने के लिए उपयोग कर सकते हैं सॉक्स
कोड बस
soundfile.dat सॉक्स soundfile.mp3 हैसॉक्स कमांड लाइन है - मैं पर मेरे मैक टर्मिनल के साथ चलते हैं, लेकिन कुछ भी है कि बैश समझता है या लिनक्स कमांड क्या cpu आप उपयोग कर रहे हैं पर निर्भर करता काम करना चाहिए।
आशा है कि मदद करता है!
आप शुद्ध डेटा को भी देखना चाहते हैं, तो यह एक सहज ग्राफिकल प्रोग्रामिंग भाषा में बनाया गया कुछ अच्छा एफएफटी ट्रांसफॉर्म है।
बीटीडब्ल्यू, मैं ग्रहण के लिए पीईडीवी के साथ मैकबुक प्रो पर चल रहा हूं, इसलिए विंडोज कन्वर्टर्स पूरी तरह से प्रश्न से बाहर नहीं हैं, वे बहुत असुविधाजनक हैं। – AlexL