Публикации по теме 'speech'


Примечания к выпуску NeuralSpace: что нового в версии 1.4.0?
Мы постоянно развиваем Платформу NeuralSpace , чтобы предоставить нашим пользователям все больше и больше языковых возможностей искусственного интеллекта. Мы собрали их вместе в нашем последнем релизе, который мы назвали Nico Robin . С двумя совершенно новыми сервисами голосового ИИ мы представили несколько крупных обновлений платформы. Прокрутите вниз, чтобы наверстать упущенное! Идентификация говорящего С этим релизом мы запускаем наш сервис Идентификация говорящего . Этот..

Распознавать речь сложно - часть 1
Речь - наиболее естественная форма общения для нас, это наша вторая натура. И теперь наши машины начали распознавать нашу речь, и они все лучше и лучше общаются с нами. Текущие голосовые помощники и устройства, такие как Amazon Alexa и Google Home, становятся все более популярными с каждым месяцем - они меняют то, как мы делаем покупки, как мы ищем, как мы взаимодействуем с нашими устройствами и даже друг с другом. Первое программное обеспечение для распознавания речи было разработано в..

Вопросы по теме 'speech'

Как реализовать выбор выпадающего списка с помощью распознавания речи в веб-браузере?
Я ищу способ выбора записи из раскрывающегося списка на веб-странице с помощью распознавания речи. Мои первоначальные мысли - использовать Google x-webkit-speech в элементе input type="text" . Затем, когда сработает событие onwebkitspeechchange...
1129 просмотров

Есть ли способ оценить сложность произношения слова?
Я пытаюсь собрать коллекцию английских слов, которые трудно произносить. Мне было интересно, есть ли какой-то алгоритм или теория, которые можно использовать, чтобы показать, насколько сложно произнести слово. Вам кажется, что это можно...
770 просмотров
schedule 15.09.2022

Как задать уровни приоритета грамматикам в SAPI?
Я создаю приложение для распознавания речи с помощью SAPI. Мне нужно иметь возможность назначать разные уровни приоритета для разных грамматик, которые я использую. (грамматика диктовки и другая грамматика, которую я определил) Мне нужно, чтобы...
454 просмотров
schedule 29.03.2024

Распознавание речи с использованием фреймворка Openears?
Operaars: платформа распознавания речи (преобразование речи в текст) для iPhone (устройства iOS). Я установил демо-приложение openears на свое устройство iPhone. Оно работает хорошо, но только для списка таких слов, как GO, CHANGE, MODEL. Можем ли мы...
3380 просмотров
schedule 27.10.2022

Файл Java TTS (преобразование текста в речь) voice.properties
Я работаю над компьютерным помощником, а это значит, что он должен распознавать мой голос и давать обратную связь или делать что-то, обратная связь должна быть голосом, сгенерированным компьютером. Я знаю, что внутри самой Java есть способ добиться...
3983 просмотров
schedule 17.12.2023

Как я могу запустить свои действия Android с помощью распознавателя речи?
Я хочу изменить этот переключатель так, чтобы вместо того, чтобы нажимать кнопки, мои действия запускались, произнося имя связанного фрукта. Например, класс Apple будет запущен, если произнести слово «Apple». Как мне переписать этот переключатель?...
893 просмотров
schedule 23.12.2023

Преобразование текста в речь
Я использую следующий код. Он работает нормально, за исключением проблемы, заключающейся в том, что у меня есть список текста для преобразования в речь. Но это единственная конвертация последней строки в речь. Вот мой код, в котором я помещаю...
1382 просмотров
schedule 26.10.2023

Как найти сходство между двумя сигналами с помощью xcorr в Matlab
Я пишу код для распознавания речи. У меня есть номер n базы данных, каждая база данных содержит одинаковое количество слов, записанных разными людьми. Я хочу сделать xcorr между, например, опорным словом «привет» со всеми словами в базе данных...
1357 просмотров
schedule 30.10.2023

Kinect Speech Recognition распознает только одно грамматическое правило
В настоящее время я разрабатываю приложение распознавания речи с использованием Microsoft Kinect SDK. Цель приложения — загрузить любой (допустимый) файл XML, содержащий грамматику, и использовать его для обработки речи. По какой-то причине, которую...
388 просмотров
schedule 22.09.2022

Преобразование речи в текст (распознавание голоса) непосредственно из аудио/транскрипции
Должна быть возможность преобразовывать или транскрибировать аудио (например, из .MP3, другого аудиоформата), содержащее речь, в текстовые расшифровки с использованием алгоритма преобразования речи в текст (распознавание голоса) с высокой точностью....
19397 просмотров
schedule 15.05.2024

Добавить файл грамматики распознавания речи в Java динамически
Я пытаюсь сделать простой код Java для преобразования речи в текст с помощью Sphinx. Я закончил свой код, но столкнулся с проблемой при создании файла грамматики. Файл грамматики кажется очень большим, есть ли способ создать файл грамматики, который...
1272 просмотров
schedule 15.12.2023

Встроенное приложение Android для преобразования текста в речь
У меня есть пара основных вопросов об использовании Android + TTS, на которые я не могу найти окончательный ответ с помощью поиска: Это встроенный коммерческий продукт для предоставления голосовых объявлений для переменных данных. Интерфейса как...
1058 просмотров
schedule 31.05.2024

Функция распознавания речи Microsoft setInputToDefaultAudioDevice выдает исключение
Привет, ребята, у меня проблемы с распознаванием речи MS. мой код прост. static void init() { string enUsEngine = string.Empty; foreach (RecognizerInfo ri in SpeechRecognitionEngine.InstalledRecognizers()) {...
1712 просмотров
schedule 22.03.2024

Не удается получить ответное сообщение при использовании речевого API Microsoft Translator
Я бесплатно создал Microsoft Translator Speech API Service в Microsoft Azure. Но когда я запускал пример проекта с этой службой, в веб-сокете не было ответного сообщения. Я уверен, что соединение было установлено, и аудиофайл был передан по...
190 просмотров
schedule 04.01.2024

JS AzureSDK создает пользовательскую функцию для захвата речи, отображения текстовых результатов и уровня достоверности результатов.
Мне нужно создать простую функцию javascript для захвата входных данных, а затем вернуть текст с процентом достоверности с помощью AzureSDK. Моя самая большая проблема в том, что я новичок в программировании, и это самая сложная проблема, с которой...
803 просмотров
schedule 25.11.2023

Событие LeftConversation для отключенных участников
Я использую шаблон быстрого запуска для разговоров с несколькими устройствами, и кажется, что обработчик события смены участника ( participantsChanged ) не срабатывает, когда участник отключается. Я ожидаю получить LeftConversation для участника,...
52 просмотров
schedule 24.11.2023