Мы постоянно развиваем Платформу NeuralSpace, чтобы предоставить нашим пользователям все больше и больше языковых возможностей искусственного интеллекта. Мы собрали их вместе в нашем последнем релизе, который мы назвали Nico Robin.

С двумя совершенно новыми сервисами голосового ИИ мы представили несколько крупных обновлений платформы. Прокрутите вниз, чтобы наверстать упущенное!

Идентификация говорящего

С этим релизом мы запускаем наш сервис Идентификация говорящего. Этот сервис автоматически определяет количество динамиков в аудиофайле и определяет, какие части звука принадлежат какому динамику.

Это идеальный инструмент для расшифровки встреч, видео с несколькими выступающими, телефонных звонков и т. д.

Извлечение голоса

Наш новый сервис Извлечение голоса плавно отделяет звук говорящего от фонового шума в аудиофайле. Это помогает улучшить качество транскрипции, особенно при наличии большого фонового шума.

Это идеальный инструмент для автоматического наложения видео. С таким сервисом вам никогда не придется беспокоиться о фоновом шуме, присутствующем в видео. Вы можете извлечь голос и фоновый звук, а затем наложить наложенный звук на фоновый звук.

Система управления файлами

Файлы теперь можно использовать в разных сервисах. Например, файл, который вы загружаете для транскрипции, можно также использовать для извлечения голоса с помощью уникального идентификатора файла, который вы получите при загрузке файла.

Страница аналитики

Новая страница аналитики теперь доступна для понимания языка и распознавания сущностей. Он сообщает вам, какие намерения и сущности работают хорошо, а какие нет. Наряду с подробным отчетом о классификации вы получаете интерактивную матрицу путаницы (показывает производительность обученной модели) для обоих сервисов.

Страница Model Analytics на платформе NeuralSpace

Матрица путаницы намерений на платформе NeuralSpace

Концепция вебхука

Вы можете зарегистрировать веб-хук на платформе прямо сейчас и получать оперативные обновления для всех асинхронных задач. Например, статус модели во время обучения, статус файла во время транскрипции, извлечения голоса или идентификации говорящего. Вы также можете получить статус пакетных запросов TTS. Таким образом, вам никогда не придется снова и снова опрашивать статусный API, чтобы выполнить последующую задачу на основе его статуса.

Языковая поддержка

Преобразование речи в текст

Мы расширили нашу языковую поддержку до 74 языков, на которых говорят в азиатском, африканском, ближневосточном и европейском регионах. Другие языки и домены будут добавлены в ближайшее время. Не стесняйтесь обращаться к нам, если у вас есть какие-либо предпочтения.

Текст в речь

Наш сервис преобразования текста в речь охватывает более 40 языков и более 200 голосов ИИ! Другие языки и голоса будут добавлены в ближайшее время. Не стесняйтесь обращаться к нам, если у вас есть какие-либо предпочтения.

Что дальше?

  • В следующем выпуске мы планируем представить совершенно новый новый конвейер AutoNLP, который работает быстрее и предлагает потрясающие результаты.
  • Модели преобразования речи в текст смогут адаптироваться в соответствии с вашим словарем, используя только текстовые данные.
  • Модели преобразования текста в речь с возможностью точного клонирования голосов знаменитостей.
  • Идентификация говорящего с использованием образцов говорящего. : вы можете загружать аудиофайлы 30-х годов для определенных динамиков, чтобы идентифицировать их по имени.

Не стесняйтесь связаться с нами или заказать звонок напрямую, если вы хотите поговорить с нашей командой более подробно.

Если вы еще этого не сделали, зарегистрируйтесь на Платформе NeuralSpace, чтобы попробовать и протестировать ее самостоятельно! Начните с кредитов на сумму 200 долларов.

Обязательно ознакомьтесь с нашей Документацией, чтобы узнать больше о платформе NeuralSpace и ее различных услугах.

Удачного НЛП!