मैं एक ज्ञात पाठ के खिलाफ एक बोले गए रिकॉर्डिंग को सिंक्रनाइज़ करना चाहता हूं। क्या कोई भाषण-से-पाठ/प्राकृतिक भाषा प्रसंस्करण लाइब्रेरी है जो इसकी सुविधा प्रदान करेगी? मुझे कल्पना है कि मैं शब्द सीमाओं का पता लगाना चाहता हूं और एक शब्दकोश से उम्मीदवार मैचों की गणना करना चाहता हूं। एसओ चिंता लिखित भाषा पर पाए गए अधिकांश प्रश्न।टेक्स्ट और ऑडियो सिंक्रनाइज़ करना। क्या ऐसा करने के लिए कोई एनएलपी/भाषण-टू-टेक्स्ट लाइब्रेरी है?
वांछित है, लेकिन जरूरी नहीं:
- मुक्त स्रोत
- अमेरिकी अंग्रेजी के साथ संगत आउट-ऑफ-द-बॉक्स
- क्रॉस-प्लेटफॉर्म
- अच्छी तरह से प्रलेखित
संपादित करें : मुझे एहसास है कि यह एक बहुत व्यापक, यहां तक कि बेवकूफ, सवाल है, इसलिए आपके मार्गदर्शन के लिए अग्रिम धन्यवाद।
मैं अब तक क्या पाया है:
- OpenEars (आईओएस स्फिंक्स/Flite आवरण)
मैं वही काम करना चाहता हूं, स्फिंक्स अत्यधिक बड़े और गलती से दस्तावेज प्रतीत होता है। आश्चर्य की बात है कि आप किस चीज के साथ समाप्त हुए हैं और यदि आप किसी और चीज के बारे में जानते हैं - मुझे लगता है कि यह प्रश्न 2 साल पहले वापस चला गया है, तब से चीजें बदलनी चाहिए? –
मैं चर्चा में और योगदान करने के लिए पर्याप्त सीखने से पहले परियोजना से आगे बढ़ गया। – Justin
रिकॉर्ड के लिए: मैं पाइथन/सी मजबूर संरेखक एनीस को बनाए रखता हूं: https://github.com/readbeyond/aeneas/ –