Публикации по теме 'voice-recognition'


Когда голос не работает
Есть ли обходной путь для быстрых команд, когда мы находимся в ситуациях, когда мы не можем использовать голос? На ум приходит несколько таких ситуаций: Застрял на телефонном звонке Застрял на встрече В лифте или метро *Недомогание* Ввязываться в неожиданный разговор Пока мы ждем, когда Neural Lace станет доступна для отправки текстовых сообщений, машинное обучение потенциально может предложить некоторые решения. Обнаружение того, когда мы опаздываем, и автоматическая..

Чем больше число, тем больше преимущество
Чем больше число, тем больше преимущество Китайская компания по машинному обучению, специализирующаяся на распознавании голоса и текста, мало известная за пределами страны, под названием iFlyTek , теперь имеет 500 миллионов пользователей и ежедневно используется миллионами людей для переводов, транскрипции из голоса в текст и т. Д. Наличие 500 миллионов пользователей - это не просто отражение размера компании, ее успеха или уровня принятия: учитывая, что мы говорим о компании,..

Вопросы по теме 'voice-recognition'

vxml: нужна помощь со встроенными грамматиками
Я просматриваю несколько примеров сценариев vxml с сайта vxml.org. Когда я вызываю сценарий, воспроизводятся подсказки, но он вообще не принимает мои входные данные. когда я говорю, он отвечает «нет ввода». могу ли я пропустить какой-то тег,...
393 просмотров
schedule 23.11.2022

Распознавание голоса, есть ли способ определить, что говорит пользователь, возможно, с помощью регулярного выражения?
Я использую функцию распознавания голоса в Android, я могу говорить в свое устройство и получать список возможных слов. Когда я говорю «начало», он дает мне следующие слова, которые, как ему кажется, он слышит: акции запас останавливаться...
618 просмотров

Распознавание голоса: прослушивание определенных голосовых команд
Есть ли способ прослушать «конкретный» набор слов в Android? Это означает, что есть список голосовых команд, таких как «Идти», «Стоп», «Вверх», «Вниз» и т. д. Android-приложение должно слушать только эти слова, и ничего больше. Все учебники, которые...
79 просмотров

автономное распознавание голоса Google в Android для Lollipop
Я работаю над распознаванием голоса в автономном режиме Google для последней версии. Я просмотрел улей Android , но это не так. работает офлайн. Я провел исследование карманного сфинкса, но для этого требуется побочный голос (около окружающего...
1222 просмотров

Как реализовать кнопку в ViewPager?
У меня есть ViewPager, и мне нужно использовать там кнопку. Кнопка должна распознавать голос и отображать его в TextView. Я реализую один и тот же макет для VoiceRecognition и для ViewPager. Вопрос: как активировать кнопку для запуска...
2353 просмотров

Python определяет ключевые слова
Я делаю и приложение, которое делает следующее: 1: Если микрофон обнаруживает какой-либо шум, он начинает записывать звук до тех пор, пока шум не будет обнаружен. После этого звук записывается в wav-файл. 2: Мне нужно найти на нем несколько...
20283 просмотров
schedule 23.10.2022

ios: как определить, использовалась ли голосовая диктовка для UITextView? Или была нажата кнопка микрофона на клавиатуре
как определить, использовалась ли голосовая диктовка для UITextView? Или была нажата кнопка микрофона на клавиатуре в текстовом окне пользовательского интерфейса
1691 просмотров

Голосовой интерфейс или распознавание речи с использованием библиотек распознавания речи C#
Будучи разработчиком C++, мне интересно узнать, возможно ли разработать голосовой интерфейс и программное обеспечение для распознавания речи, такое как Amazon Alexa, но с использованием речевых библиотек C# для открытия определенного программного...
231 просмотров

Как поговорить с человеком в голосовом чате Agoro
Я использую Agoro io unity SDK для реализации функции голосового чата в игре. Это работает. Я хочу знать, какие пользователи подключаются к моему каналу. и мне нужно в личном чате с отдельным человеком. Например, на моем канале 10 человек. Лицо1,...
54 просмотров
schedule 15.11.2023

SpeechRecognizer.startListening не работает на Chromebook 10, но работает на Pixel 2XL
У меня есть код распознавания голоса, который вылетает при запуске (после заставки). Мое приложение отлично работает без распознавания голоса, но для этого приложения требуется, чтобы оно у меня было. Этот Acer Chromebook 10 за пределами моей...
153 просмотров

Проблемы WebSocket с IBM Watson
Это так неприятно. Я хочу создать простое приложение для преобразования речи в текст, но у меня проблемы с подключением. Я могу получить токен, но что-то не так, вот экраны: ошибка рукопожатия , https://i.stack.imgur.com/uJt0E.png . Сначала я...
237 просмотров

Я не могу изменить голос с помощью модуля pyttsx3! Любая индексация возвращает мне только ДЭВИДА
Я пытаюсь создать виртуального помощника. Мне нужен голос с именем PaulM, который присутствует в моем regedit. Но любой индекс возвращает мне только голос DAVID, даже не ZIRA или какой-либо другой. import pyttsx3 import datetime import...
224 просмотров

Mozilla-DeepSpeech: составьте предложение и получите соответствующий процент распознавания голоса
Можно ли передать текстовое предложение и звуковой образец программному обеспечению Mozilla-DeepSpeech и получить соответствующий процент обоих? Это сделать программное обеспечение викторины. Программа знает ответ и просит пользователя произнести...
39 просмотров

Получить текст вокруг курсора ввода в Linux
Мотивация: я пытаюсь написать сценарии, которые отправляют нажатия клавиш в текущее окно. Прямо сейчас я использую xdotool , который позволяет мне отправлять необработанные нажатия клавиш. Однако я хочу, чтобы точные нажатия клавиш зависели от...
36 просмотров
schedule 16.05.2024

Преобразование голоса A в голос B с помощью librosa
Я новичок в librosa и voice/sound анализе. Я искал этот прямой вопрос в SO и google , но не получил понятного ответа. Предположим, что есть два голоса A и B . Я хочу преобразовать voice A в voice B . Учитывая оба голоса, можно ли...
456 просмотров