Я получаю данные от Kinect v2, который (я полагаю, информацию трудно найти) представляет собой монофонический звук 16 кГц в 32-битном формате PCM с плавающей запятой. Данные поступают в виде 4 «подкадров», каждый из которых содержит 256 выборок.
Когда я отправляю эти данные в lame.exe с помощью -r -s 16 --bitwidth 32 -m m
, я получаю вывод, содержащий пробелы (предположительно, там, где должен быть второй канал). Однако эти переключатели командной строки должны принимать стерео и понижать его до моно.
Я также пытался импортировать необработанные данные в Audacity, но до сих пор не могу понять, как правильно получить из них непрерывный звук.
РЕДАКТИРОВАТЬ: я могу получить непрерывный звук, когда сохраняю только первый подкадр. Однако звук по-прежнему звучит не так.