यह Google भाषण API दस्तावेज़ है: https://cloud.google.com/speech/docs/sync-recognizeGoogle भाषण एपीआई का उपयोग करके लाइव स्ट्रीमिंग का अनुवाद कैसे करें?
मैं 2 सप्ताह के लिए इस API को आजमाता हूं। लेकिन अभी भी मेरा मुख्य उद्देश्य हल नहीं कर सकता (लाइव स्ट्रीमिंग का अनुवाद)।
मैं PHP का उपयोग कर रहा हूं। (अन्य languange सुझाव अनुमति दी है, मैं अपने आप से मिल जाएगा)
क्या मैं अपने 2 सप्ताह में कर सकते हैं:
तुल्यकालिक वाक् पहचान (< = 1min)
असिंक्रोनस स्पीच रिकग्निशन (> 1min और < = 80min)। नोट: मैं इसे 3 घंटे वीडियो स्वीकार करने के लिए संशोधित कर सकता हूं। माइक से
लाइव वाक् पहचान: https://www.google.com/intl/en/chrome/demos/speech.html
अद्यतन: 6sec अवधि से कम ऑडियो के साथ स्ट्रीमिंग एपीआई निष्पादित करें।
मैं क्या नहीं कर सकता है:
कैसे लाइव स्ट्रीमिंग का अनुवाद करने के लिए। पूर्व: रेडियो स्ट्रीमिंग (देरी की अनुमति है)
वीडियो/ऑडियो खेलने के दौरान अनुवाद कैसे करें। (देरी की अनुमति दी है)
अद्यतन:
मैं भी भी गूगल GitHub पर सवाल पूछने के। लेकिन चूंकि कोई जवाब नहीं है, मैं here पूछता हूं।
सारांश:
मैं भाषण स्ट्रीमिंग का प्रदर्शन कर सकते हैं, लेकिन केवल के साथ 6 दूसरे ऑडियो। यह मेरी अपेक्षा की तरह नहीं है। मेरी उम्मीद असीमित अवधि को पहचानना है (ऐसा लगता है कि रेडियो स्ट्रीमिंग समाप्त होने पर हमें नहीं पता)।
किसी भी मदद के लिए धन्यवाद। मैं बहुत सराहना करते हैं यह
#UPDATE:
स्वीकृत करने के लिए है कि मैं नहीं कर सकते 6sec से अधिक समय वीडियो का उपयोग करें। तो मैं इसे लिखता हूं:
मैं इस वीडियो को interview.mp4 आज़माता हूं और इसे ffmpeg -i interview.mp4 -c:a flac -ar 16000 -ac 1 -sample_fmt s16 interview.flac
का उपयोग करके ffmpeg से interview.flac में परिवर्तित करता हूं।
मैं इस library का उपयोग इस आदेश का उपयोग वीडियो अनुलेखन:
php speech.php transcribe --encoding FLAC --language-code en-US --sample-rate 16000 --stream interview.flac
और परिणाम है:
[Google\GAX\ApiException]
Invalid 'audio_content': too long.
यह नहीं कर सकते, बहुत लंबा हो गया क्योंकि वीडियो अवधि केवल 48 है सेकंड।
Output #0, flac, to 'interview.flac':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2avc1mp41
encoder : Lavf57.72.101
Stream #0:0(und): Audio: flac, 16000 Hz, mono, s16, 128 kb/s (default)
Metadata:
handler_name : SoundHandler
encoder : Lavc57.92.100 flac
size= 810kB time=00:00:48.01 bitrate= 138.1kbits/s speed= 108x
video:0kB audio:801kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.019650%
धन्यवाद ब्लैम्बर्ट, मैंने आपकी मदद को बढ़ा दिया। लेकिन, कृपया मेरा अपडेट देखें .. मुझे पहले सूचना याद आती है। माफ़ कीजिये। – plonknimbuzz
मुझे नहीं पता कि असली स्ट्रीमिंग में इसे कैसे कार्यान्वित किया जाए। मैं सिर्फ भाषण स्ट्रीमिंग एपीआई – plonknimbuzz
पर 6 सेकंड ऑडियो भेजने के बारे में जानता हूं स्ट्रीमिंग एपीआई की 60 सेकंड की सीमा है, 6 नहीं, इसलिए आपको 60 सेकंड तक ऑडियो स्ट्रीम करने में सक्षम होना चाहिए। क्या आपको 6 सेकंड के बाद त्रुटि संदेश मिल रहा है? – blambert