Обнаружение языкового кода разговорного языка в Google Speech API

Есть ли возможность автоматически определять разговорный язык с помощью Speech API Google Cloud Platform Machine Learning?

https://cloud.google.com/speech/docs/languages указывает список поддерживаемые языки. Однако пользователю необходимо вручную установить этот параметр для выполнения преобразования речи в текст. Я хотел бы сделать это автоматически.


person Jon Stark    schedule 04.07.2017    source источник
comment
он работает в приложении Google Translate, когда мы делаем голосовой перевод, он слушает оба языка и выполняет перевод между двумя, в зависимости от того, что было сказано, как я могу реализовать то же самое в своем приложении, прямо сейчас мое приложение выполняет перевод между вводом и язык вывода, но не может выполнять наоборот одновременно   -  person Jon Stark    schedule 04.07.2017
comment
Привет, тебе удалось решить эту проблему?   -  person JLT    schedule 11.06.2018
comment
@finalstatic опубликовал ответ, который вы можете просмотреть, если он вам поможет.   -  person Jon Stark    schedule 11.06.2018
comment
Спасибо, что поделился! :)   -  person JLT    schedule 11.06.2018
comment


Ответы (3)


Нет, я полагаю, что вы (по крайней мере, в настоящее время) должны указать язык ввода. (В отличие, например, от API перевода, где вы можете позволить ему автоматически определять.)

person Jon Skeet    schedule 04.07.2017
comment
хорошо, спасибо, понял, но в приложении Google Translate, когда мы выбираем два языка для голосового перевода, мы можем говорить на любом из двух языков, которые автоматически определяются из двух, как реализовать эту функцию - person Jon Stark; 04.07.2017
comment
@JonStark: я не знаю, возможно ли это с текущим API. Возможно, в будущем это будет возможно, я не знаю. - person Jon Skeet; 04.07.2017

Google не предоставляет прямого API для определения разговорного языка, поэтому его можно реализовать с помощью следующих шагов, хотя это не на 100% точно:

1. Используйте Google Voice API для преобразования голоса в текст.

2. отправьте разговорный голос на API один за другим с обоими выбранными языковыми кодами.

3. В ответе API указывается значение достоверности и количество альтернатив.

4. Сравните значение достоверности обоих выходных данных и используйте тот, у которого значение достоверности выше.

Хотя это не точный способ сделать это, но это просто обходной путь, если он может кому-то помочь.

person Jon Stark    schedule 11.06.2018

Теперь есть бета-версия, которая помогает, см. главу «Автоматическое определение языка» в документе Google Speech API: https://cloud.google.com/speech-to-text/docs/multiple-languages

person Giorgio Robino    schedule 03.11.2019