Какая реализация bzip2 имеет наибольшую скорость распаковки?
Существует http://bitbucket.org/james_taylor/seek-bzip2/src/tip/micro-bunzip.c, который утверждает
Оптимизация размера и скорости — Мануэль Новоа III ([email protected]). Более эффективное чтение кодов Хаффмана, оптимизированная функция read_bunzip() и различные другие настройки. В (ограниченных) тестах примерно на 20% быстрее, чем bzcat на x86 и примерно на 10% быстрее на ARM. Обратите внимание, что около 2/3 времени тратится в read_unzip() на обращение преобразования Берроуза-Уилера. Большая часть этого времени приходится на задержку из-за промахов кеша.
Многие промахи кэша могут быть оптимизированы с помощью некоторых методов, поэтому возможны еще более быстрые реализации.
Этот (seek-bzip2) также имеет интересную функцию простого поиска во входном файле.
Моя программа будет использовать вывод bzip2 и (теоретически) может делать это параллельно в разных частях файла. Таким образом, рассматриваются и параллельные реализации bzip2.
Спасибо.