Я делаю и приложение, которое делает следующее:
1:
Если микрофон обнаруживает какой-либо шум, он начинает записывать звук до тех пор, пока шум не будет обнаружен. После этого звук записывается в wav-файл.
2:
Мне нужно найти на нем несколько слов. Есть только, от 5 до 10 слов для обнаружения.
Пока что мой код выполняет только первую часть (обнаруживает шум и записывает звук). Теперь у меня есть список со следующими словами: help, please, yes, no, could, you, after, tomorrow
. Мне нужен автономный способ определить, содержит ли мой звук эти слова. Это возможно? Как я могу это сделать? Я использую Linux, и нет возможности изменить мою операционную систему на Windows или использовать виртуальную машину.
Я думаю использовать спектрограмму звука, создать базу данных поездов и использовать какой-нибудь классификатор для прогнозирования. Например, это — это спектрограмма слова. Это хорошая техника для использования?
Спасибо.