Я ищу хороший алгоритм сжатия без потерь, который может очень быстро сжимать / распаковывать небольшие объемы данных, например 256 чисел с плавающей запятой, которые находятся в диапазоне от 0 до 1. Я знаю RLE, но, возможно, есть что-то получше.
Фон состоит в том, что я работаю с объемными данными (например, 384 ³ с плавающей запятой) с помощью CUDA, и вместо того, чтобы явно сохранять объем, я хочу разделить его на блоки размером 8x8x4 и сохранить сжатые блоки. Ядра CUDA (каждый блок, состоящий из потоков 8x8x4) распаковывают соответствующий блок, работают с ним и снова сжимают.
Благодарю за любые предложения!