Вопросы по теме 'speech-to-text'

создать контекстно-свободную грамматику для распознавания речи
Мы хотим создать файл грамматики. Есть ли другой способ, кроме (hello|goodmorning)(jack|jill) , указать вероятный набор первых слов, а затем набор вторых слов? Мы используем его для распознавания речи из видео для создания субтитров.
213 просмотров

Преобразование речи в текст в WP7 или Windows 8 Metro
Я думаю, что вопрос в значительной степени говорит сам за себя. Есть ли какой-либо API, с помощью которого я могу принимать речевой ввод от пользователя, а затем преобразовывать его в текст? (Windows Phone 7 или Windows 8 Metro)?
877 просмотров

Преобразование ЛЮБОГО предложения в текст с помощью речи Windows
В настоящее время у меня есть программа на C#, которая принимает речь с помощью системы распознавания речи (SR) MS Windows, преобразует ее в текст, отправляет вопрос в виде текста в Worlfram Alpha, а затем читает текстовый ответ обратно, используя...
969 просмотров

Грамматика под диктовку на Sphinx-4
Я использую Sphinx-4 для преобразования голоса в текст, но мне нужно, чтобы приложение распознавало грамматику, а затем продиктовывало последовательность слов. Например, имея следующую грамматику: public <greet> = (Good morning | Hello);...
995 просмотров

автономное распознавание голоса Google в Android для Lollipop
Я работаю над распознаванием голоса в автономном режиме Google для последней версии. Я просмотрел улей Android , но это не так. работает офлайн. Я провел исследование карманного сфинкса, но для этого требуется побочный голос (около окружающего...
1222 просмотров

Преобразование речи в текст, API речи Java, где его найти?
Итак, я хотел создать небольшое приложение для своей домашней лаборатории, и мне нужно распознавание речи, поэтому речевой API Java кажется довольно хорошим решением моей проблемы с поиском подходящего API. Я попробовал API Sphinx-4, но не смог найти...
1531 просмотров

насколько большим будет файл hello.gram в sphinx java
Я новичок в sphinx java и начал с небольшого проекта сведений о сотрудниках. Загрузите программу HelloWorld и модифицируйте ее. как динамически получить идентификатор сотрудника (например: T5438, Y7651, U9085) и отдел (Auto, Support, Mobile). Как...
192 просмотров
schedule 07.12.2022

Cmusphinx Испанская модель бессвязной транскрипции
Я установил pocketsphinx на свой ноутбук (Linux Mint 17), чтобы преобразовать аудиофайл WAV в текст. Звуки на испанском языке, поэтому я загрузил испанскую модель Voxforge 0.2 с его веб-сайта и скопировал-вставил-адаптировал следующий код:...
441 просмотров
schedule 04.05.2024

Как включить речь Webkit для текста в хроме 51?
Я использую Jessie на raspberry pi, браузер по умолчанию поддерживает chromium V51, но я не могу запустить модуль WebKit для преобразования речи в текст, который отлично работает в Google Chrome. Пожалуйста, помогите мне, если кто-то решил это ранее....
336 просмотров
schedule 19.09.2022

Watson Conversation в живом телефонном звонке
Может ли кто-нибудь показать мне, как использовать Watson Conversation и другие службы (например, Twilio), чтобы сделать телефонный звонок в режиме реального времени и продолжить разговор? Я могу использовать Watson Conversation, Twilio и NodeRED...
1598 просмотров

Должен ли я использовать Android Speech Recognizer в своем приложении для сбора данных?
Я не хочу, чтобы мое приложение контролировало и выполняло некоторые задачи на телефоне пользователя, например, устанавливало будильник или звонило кому-то. Я нашел много руководств, посвященных этому. Я хочу собирать данные с помощью API-интерфейса...
401 просмотров

Использование Amazon Polly Text to Speech для имитации интонации реальной речевой волны из аудиофайла
Я хочу воспроизводить очень реалистично звучащую речь с помощью Amazon Polly - более реалистичную, чем результаты, полученные при разрешении Amazon Polly генерировать речевой аудиовыход из обычного ввода текста. Для этого я хочу сказать Полли, чтобы...
244 просмотров

Субъекты-помощники и разные выступающие
Можно различать говорящих / пользователей с помощью Watson-Unity-SDK, поскольку он, кажется, может возвращать массив, который определяет, какие слова были произнесены какими говорящими в многопользовательском обмене, но я не могу понять, как это...
83 просмотров

Node.js — Google Cloud Speech API — проблема с прослушивателем событий
Я использую Google Cloud Speech API для потоковый ввод . Мне нужна возможность обрабатывать событие, которое запускается сразу после обнаружения звука. Я думаю, что подходящим является readable . За исключением того, что я еще не мог заставить...
75 просмотров
schedule 08.02.2024

JS AzureSDK создает пользовательскую функцию для захвата речи, отображения текстовых результатов и уровня достоверности результатов.
Мне нужно создать простую функцию javascript для захвата входных данных, а затем вернуть текст с процентом достоверности с помощью AzureSDK. Моя самая большая проблема в том, что я новичок в программировании, и это самая сложная проблема, с которой...
803 просмотров
schedule 25.11.2023

Как включить уверенность на уровне слов для службы преобразования речи в текст MS Azure
Как добиться уверенности на уровне слов для каждого слова с помощью службы преобразования речи MS Azure в текст? В настоящее время я получаю значение достоверности для уровня предложения, и мне требуется достоверность на уровне слов для дальнейшей...
470 просмотров

Microsoft Cognitive Speech to Text - не преобразование всего файла .wav
При попытке преобразовать личный файл .wav только часть речи преобразуется в текст, и преобразование каждый раз останавливается в одном и том же месте. Мне не удалось найти что-либо в документации, если есть ограничение на размер файла (мой файл...
727 просмотров