2010-07-05 17 views
6

मेरे पास एक ऑडियो स्ट्रीम है और मैं इससे शब्दों (भाषण) निकाल दूंगा। तो उदाहरण के लिए audio.wav होने पर मुझे 001.wav, 002.wav, 003.wav, आदि मिलेगा जहां प्रत्येक XXX.wav एक शब्द है।ऑडियो स्ट्रीम से शब्दों (भाषण) निकालने के लिए पुस्तकालय?

मैं इसे करने के लिए एक पुस्तकालय या प्रोग्राम की तलाश में हूं - प्लेटफॉर्म कोई फर्क नहीं पड़ता, लेकिन मैं ओपन-सोर्स समाधान पसंद करता हूं।

सहायता के लिए अग्रिम धन्यवाद।

उत्तर

2

Nuance, जो Dragon Naturally Speaking बनाता है, की संख्या Software Development Kits है।

Audio Mining किट आपकी आवश्यकताओं से मेल लगता है:

ड्रैगन NaturallySpeaking एसडीके AudioMining एक वक्ता स्वतंत्र भाषण मान्यता टूलकिट कि ऑडियो फाइलों के भीतर भाषण जानकारी के 100% का अनुक्रमण सक्षम बनाता है। तकनीक ऑडियो फ़ाइलों को को टाइमस्टैम्प जानकारी के साथ एक्सएमएल टेक्स्ट में बदलने के लिए अत्यधिक सटीक भाषण मान्यता का उपयोग करती है। इसे एकीकृत पाठ-खोज उत्पादों के साथ पर एकीकृत ऑडियो सामग्री तक त्वरित पहुंच सक्षम करने के लिए एकीकृत किया जा सकता है।

भाषण + मेटाडाटा भाषण सही पाने के लिए सबसे कठिन हिस्सा दूर और दूर है। एक बार आपके पास भाषण + मेटाडाटा हो, शब्दों को अलग-अलग ऑडियो फ़ाइलों के रूप में निकालने much more straightforward है।

+0

एनबी ऑडियो खनन किट का उल्लेख निम्नलिखित चेतावनी के साथ आता है: "** ड्रैगन ऑडियोमेनिंग तकनीक विशेष रूप से यूएस अंग्रेज़ी के लिए डिज़ाइन की गई है और मीटिंग्स या साक्षात्कारों के प्रतिलेखन के लिए इसका इरादा नहीं है। **" – LeeGee

+0

@ ग्रीनोल्डमैन ने ओपन-सोर्स समाधान –

+0

ऑनलाइन Nuance AudioMining पर जानकारी ढूंढना बहुत मुश्किल है। और यह विरोधाभासी प्रतीत होता है, क्योंकि 1 999 में उत्पाद लॉन्च में बैठकों और साक्षात्कारों के प्रतिलेखन का स्पष्ट रूप से उल्लेख किया गया था: https://www.youtube.com/watch?v=yagvFY_rUwM – Christoph

संबंधित मुद्दे