2017-05-25 11 views
9

यह Google भाषण API दस्तावेज़ है: https://cloud.google.com/speech/docs/sync-recognizeGoogle भाषण एपीआई का उपयोग करके लाइव स्ट्रीमिंग का अनुवाद कैसे करें?

मैं 2 सप्ताह के लिए इस API को आजमाता हूं। लेकिन अभी भी मेरा मुख्य उद्देश्य हल नहीं कर सकता (लाइव स्ट्रीमिंग का अनुवाद)।

मैं PHP का उपयोग कर रहा हूं। (अन्य languange सुझाव अनुमति दी है, मैं अपने आप से मिल जाएगा)

क्या मैं अपने 2 सप्ताह में कर सकते हैं:

  1. तुल्यकालिक वाक् पहचान (< = 1min)

  2. असिंक्रोनस स्पीच रिकग्निशन (> 1min और < = 80min)। नोट: मैं इसे 3 घंटे वीडियो स्वीकार करने के लिए संशोधित कर सकता हूं। माइक से

  3. लाइव वाक् पहचान: https://www.google.com/intl/en/chrome/demos/speech.html

  4. अद्यतन: 6sec अवधि से कम ऑडियो के साथ स्ट्रीमिंग एपीआई निष्पादित करें।

मैं क्या नहीं कर सकता है:

  1. कैसे लाइव स्ट्रीमिंग का अनुवाद करने के लिए। पूर्व: रेडियो स्ट्रीमिंग (देरी की अनुमति है)

  2. वीडियो/ऑडियो खेलने के दौरान अनुवाद कैसे करें। (देरी की अनुमति दी है)

अद्यतन:

मैं भी भी गूगल GitHub पर सवाल पूछने के। लेकिन चूंकि कोई जवाब नहीं है, मैं here पूछता हूं।

सारांश:

मैं भाषण स्ट्रीमिंग का प्रदर्शन कर सकते हैं, लेकिन केवल के साथ 6 दूसरे ऑडियो। यह मेरी अपेक्षा की तरह नहीं है। मेरी उम्मीद असीमित अवधि को पहचानना है (ऐसा लगता है कि रेडियो स्ट्रीमिंग समाप्त होने पर हमें नहीं पता)।

किसी भी मदद के लिए धन्यवाद। मैं बहुत सराहना करते हैं यह

#UPDATE:

स्वीकृत करने के लिए है कि मैं नहीं कर सकते 6sec से अधिक समय वीडियो का उपयोग करें। तो मैं इसे लिखता हूं:

मैं इस वीडियो को interview.mp4 आज़माता हूं और इसे ffmpeg -i interview.mp4 -c:a flac -ar 16000 -ac 1 -sample_fmt s16 interview.flac का उपयोग करके ffmpeg से interview.flac में परिवर्तित करता हूं।

मैं इस library का उपयोग इस आदेश का उपयोग वीडियो अनुलेखन:

php speech.php transcribe --encoding FLAC --language-code en-US --sample-rate 16000 --stream interview.flac

और परिणाम है:

[Google\GAX\ApiException] 
    Invalid 'audio_content': too long. 

यह नहीं कर सकते, बहुत लंबा हो गया क्योंकि वीडियो अवधि केवल 48 है सेकंड।

Output #0, flac, to 'interview.flac': 
    Metadata: 
    major_brand  : isom 
    minor_version : 512 
    compatible_brands: isomiso2avc1mp41 
    encoder   : Lavf57.72.101 
    Stream #0:0(und): Audio: flac, 16000 Hz, mono, s16, 128 kb/s (default) 
    Metadata: 
     handler_name : SoundHandler 
     encoder   : Lavc57.92.100 flac 
size=  810kB time=00:00:48.01 bitrate= 138.1kbits/s speed= 108x 
video:0kB audio:801kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.019650% 

उत्तर

6

StreamingRecognize API call उपयोग करने के लिए आप की जरूरत है: इस ffmpeg परिणाम से मेटा है। आप PHP here में ऐसा करने का एक उदाहरण पा सकते हैं।

+0

धन्यवाद ब्लैम्बर्ट, मैंने आपकी मदद को बढ़ा दिया। लेकिन, कृपया मेरा अपडेट देखें .. मुझे पहले सूचना याद आती है। माफ़ कीजिये। – plonknimbuzz

+0

मुझे नहीं पता कि असली स्ट्रीमिंग में इसे कैसे कार्यान्वित किया जाए। मैं सिर्फ भाषण स्ट्रीमिंग एपीआई – plonknimbuzz

+0

पर 6 सेकंड ऑडियो भेजने के बारे में जानता हूं स्ट्रीमिंग एपीआई की 60 सेकंड की सीमा है, 6 नहीं, इसलिए आपको 60 सेकंड तक ऑडियो स्ट्रीम करने में सक्षम होना चाहिए। क्या आपको 6 सेकंड के बाद त्रुटि संदेश मिल रहा है? – blambert

संबंधित मुद्दे