2010-11-01 7 views
12

मैं एक ज्ञात पाठ के खिलाफ एक बोले गए रिकॉर्डिंग को सिंक्रनाइज़ करना चाहता हूं। क्या कोई भाषण-से-पाठ/प्राकृतिक भाषा प्रसंस्करण लाइब्रेरी है जो इसकी सुविधा प्रदान करेगी? मुझे कल्पना है कि मैं शब्द सीमाओं का पता लगाना चाहता हूं और एक शब्दकोश से उम्मीदवार मैचों की गणना करना चाहता हूं। एसओ चिंता लिखित भाषा पर पाए गए अधिकांश प्रश्न।टेक्स्ट और ऑडियो सिंक्रनाइज़ करना। क्या ऐसा करने के लिए कोई एनएलपी/भाषण-टू-टेक्स्ट लाइब्रेरी है?

वांछित है, लेकिन जरूरी नहीं:

  • मुक्त स्रोत
  • अमेरिकी अंग्रेजी के साथ संगत आउट-ऑफ-द-बॉक्स
  • क्रॉस-प्लेटफॉर्म
  • अच्छी तरह से प्रलेखित

संपादित करें : मुझे एहसास है कि यह एक बहुत व्यापक, यहां तक ​​कि बेवकूफ, सवाल है, इसलिए आपके मार्गदर्शन के लिए अग्रिम धन्यवाद।

मैं अब तक क्या पाया है:

  • OpenEars (आईओएस स्फिंक्स/Flite आवरण)
+0

मैं वही काम करना चाहता हूं, स्फिंक्स अत्यधिक बड़े और गलती से दस्तावेज प्रतीत होता है। आश्चर्य की बात है कि आप किस चीज के साथ समाप्त हुए हैं और यदि आप किसी और चीज के बारे में जानते हैं - मुझे लगता है कि यह प्रश्न 2 साल पहले वापस चला गया है, तब से चीजें बदलनी चाहिए? –

+0

मैं चर्चा में और योगदान करने के लिए पर्याप्त सीखने से पहले परियोजना से आगे बढ़ गया। – Justin

+1

रिकॉर्ड के लिए: मैं पाइथन/सी मजबूर संरेखक एनीस को बनाए रखता हूं: https://github.com/readbeyond/aeneas/ –

उत्तर

10

मजबूर संरेखण

ऐसा लगता है कि आप forced alignment क्या करना चाहते हैं आपके ऑडियो और ज्ञात पाठ के बीच।

बहुत अधिक शोध/उद्योग ग्रेड भाषण मान्यता प्रणाली ऐसा करने में सक्षम होंगे, क्योंकि मजबूर संरेखण डेटा पर एक मान्यता प्रणाली को प्रशिक्षण देने का एक महत्वपूर्ण हिस्सा है जिसमें phone ऑडियो और ट्रांसक्रिप्ट के बीच स्तर संरेखण नहीं है।

संरेखण CMUSphinx

CMU का ओपन सोर्स वाक् पहचान प्रणाली के Sphinx4-1.0 beta 5 release अब कैसे एक प्रतिलिपि और लंबे भाषण रिकॉर्डिंग के बीच संरेखण करने के बारे में एक डेमो भी शामिल है।

+0

शानदार। मुझे नहीं पता था कि यह मेरी नाक के नीचे सही था। – Justin

+0

यह स्फिंक्स एक बहुत उपयोगी दिखने वाली लाइब्रेरी है, लेकिन आईफोन पर उपयोग करने के निर्देशों के बारे में निर्देश काफी दिनांकित हैं (आईओएस 3?) और टिप्पणियां बताती हैं कि आईओएस 4 पर लागू करना आसान नहीं है। मुझे आश्चर्य है कि इस उपलब्ध पर अधिक अद्यतित जानकारी है या नहीं? –

संबंधित मुद्दे