ऑडियो स्ट्रीम से शब्दों (भाषण) निकालने के लिए पुस्तकालय?

मेरे पास एक ऑडियो स्ट्रीम है और मैं इससे शब्दों (भाषण) निकाल दूंगा। तो उदाहरण के लिए audio.wav होने पर मुझे 001.wav, 002.wav, 003.wav, आदि मिलेगा जहां प्रत्येक XXX.wav एक शब्द है।ऑडियो स्ट्रीम से शब्दों (भाषण) निकालने के लिए पुस्तकालय?

मैं इसे करने के लिए एक पुस्तकालय या प्रोग्राम की तलाश में हूं - प्लेटफॉर्म कोई फर्क नहीं पड़ता, लेकिन मैं ओपन-सोर्स समाधान पसंद करता हूं।

सहायता के लिए अग्रिम धन्यवाद।

स्रोत

2010-07-05 greenoldman

Nuance, जो Dragon Naturally Speaking बनाता है, की संख्या Software Development Kits है।

Audio Mining किट आपकी आवश्यकताओं से मेल लगता है:

ड्रैगन NaturallySpeaking एसडीके AudioMining एक वक्ता स्वतंत्र भाषण मान्यता टूलकिट कि ऑडियो फाइलों के भीतर भाषण जानकारी के 100% का अनुक्रमण सक्षम बनाता है। तकनीक ऑडियो फ़ाइलों को को टाइमस्टैम्प जानकारी के साथ एक्सएमएल टेक्स्ट में बदलने के लिए अत्यधिक सटीक भाषण मान्यता का उपयोग करती है। इसे एकीकृत पाठ-खोज उत्पादों के साथ पर एकीकृत ऑडियो सामग्री तक त्वरित पहुंच सक्षम करने के लिए एकीकृत किया जा सकता है।

भाषण + मेटाडाटा भाषण सही पाने के लिए सबसे कठिन हिस्सा दूर और दूर है। एक बार आपके पास भाषण + मेटाडाटा हो, शब्दों को अलग-अलग ऑडियो फ़ाइलों के रूप में निकालने much more straightforward है।

स्रोत

2010-07-06 12:08:40 mattbh

एनबी ऑडियो खनन किट का उल्लेख निम्नलिखित चेतावनी के साथ आता है: "** ड्रैगन ऑडियोमेनिंग तकनीक विशेष रूप से यूएस अंग्रेज़ी के लिए डिज़ाइन की गई है और मीटिंग्स या साक्षात्कारों के प्रतिलेखन के लिए इसका इरादा नहीं है। **" – LeeGee

@ ग्रीनोल्डमैन ने ओपन-सोर्स समाधान –

ऑनलाइन Nuance AudioMining पर जानकारी ढूंढना बहुत मुश्किल है। और यह विरोधाभासी प्रतीत होता है, क्योंकि 1 999 में उत्पाद लॉन्च में बैठकों और साक्षात्कारों के प्रतिलेखन का स्पष्ट रूप से उल्लेख किया गया था: https://www.youtube.com/watch?v=yagvFY_rUwM – Christoph

ऑडियो स्ट्रीम से शब्दों (भाषण) निकालने के लिए पुस्तकालय?

उत्तर

संबंधित मुद्दे