Правильный способ кодирования звука Kinect с помощью lame.exe

Я получаю данные от Kinect v2, который (я полагаю, информацию трудно найти) представляет собой монофонический звук 16 кГц в 32-битном формате PCM с плавающей запятой. Данные поступают в виде 4 «подкадров», каждый из которых содержит 256 выборок.

Когда я отправляю эти данные в lame.exe с помощью -r -s 16 --bitwidth 32 -m m, я получаю вывод, содержащий пробелы (предположительно, там, где должен быть второй канал). Однако эти переключатели командной строки должны принимать стерео и понижать его до моно.

Я также пытался импортировать необработанные данные в Audacity, но до сих пор не могу понять, как правильно получить из них непрерывный звук.

РЕДАКТИРОВАТЬ: я могу получить непрерывный звук, когда сохраняю только первый подкадр. Однако звук по-прежнему звучит не так.


person Simon Verbeke    schedule 26.04.2015    source источник


Ответы (1)


В итоге я остановился на Ogg Vorbis. Свободный формат, так что тут тоже никаких проблем. Я использую следующие параметры командной строки для oggenc2.exe:

oggenc2.exe --raw-format=3 --raw-chan=1 --raw-rate=16000 - --output=[filename]
person Simon Verbeke    schedule 22.05.2015