Как работи възприятието за изкривяване на скоростта, част 3

Представления за универсална скорост-изкривяване-възприятие за компресия със загуби (arXiv)

Автор : George Zhang, Jingjing Qian, Jun Chen, Ashish Khisti

Резюме: В контекста на компресията със загуби Blau & Michaeli (2019) възприемат математическо понятие за качество на възприемане и дефинират функцията скорост-изкривяване-възприятие, обобщавайки класическия компромис скорост-изкривяване. Ние разглеждаме идеята за универсални представяния, при които човек може да фиксира енкодер и да променя декодера, за да постигне всяка точка в колекция от ограничения на изкривяване и възприятие. Ние доказваме, че съответната информационно-теоретична универсална функция за скорост-изкривяване-възприятие е оперативно постижима в приблизителен смисъл. При MSE изкривяване, ние показваме, че целият компромис между изкривяване и възприемане на източник на Гаус може да бъде постигнат от един енкодер със същата скорост асимптотично. След това характеризираме постижимата област на възприемане на изкривяване за фиксирано представяне в случай на произволни разпределения, идентифицираме условията, при които гореспоменатите резултати продължават да се поддържат приблизително, и изучаваме случая, когато скоростта не е фиксирана предварително. Това мотивира проучването на практически конструкции, които са приблизително универсални в компромиса на RDP, като по този начин облекчава необходимостта от проектиране на нов енкодер за всяка цел. Предоставяме експериментални резултати за MNIST и SVHN, които предполагат, че при задачите за компресиране на изображения, оперативните компромиси, постигнати от моделите за машинно обучение с фиксиран енкодер, търпят само малко наказание в сравнение с техния аналог с променлив енкодер

2. Практически подход за анализ на скорост-изкривяване-възприемане при научена компресия на изображение (arXiv)

Автор : Огун Кирмемис, А. Мурат Текалп

Резюме: Оптимизирането на скоростта на изкривяване (RDO) на кодеци, където изкривяването се определя количествено чрез средноквадратична грешка, е стандартна практика при компресиране на изображение/видео през годините. RDO служи добре за оптимизиране на производителността на кодека за оценка на резултатите по отношение на PSNR. Добре известно е обаче, че PSNR не корелира добре с перцептивната оценка на изображенията; следователно RDO не е много подходящ за перцептивна оптимизация на кодеци. Наскоро компромисът скорост-изкривяване-възприятие беше формализиран чрез приемане на разминаването на Kullback-Leibner (KL) между разпределенията на оригиналните и реконструираните изображения като мярка за възприятие. Бяха предложени научени методи за компресиране на изображения, които едновременно оптимизират скоростта, средноквадратната загуба, VGG загубата и противопоставящата се загуба. И все пак не съществува лесен подход за фиксиране на скоростта, изкривяването или възприятието на желано ниво в практическо научено решение за компресиране на изображение, за да се извърши анализ на компромиса между мерките за скорост, изкривяване и възприятие. В тази статия ние предлагаме практически подход за фиксиране на скоростта за извършване на анализ на възприятие-изкривяване с фиксирана скорост, за да се извърши перцептивна оценка на резултатите от компресията на изображението по принципен начин. Експерименталните резултати предоставят няколко прозрения за практически анализ на скорост-изкривяване-възприятие в наученото компресиране на изображението

Как работи възприятието за изкривяване на скоростта, част 3

Подобни въпроси