k* значения воспроизведения?

Я читаю о квантовании продукта в разделе II.A, стр. 3 PQ для NNS, в котором говорится:

..все субквантизаторы имеют одинаковое конечное число k* значений воспроизведения. В этом случае число центроидов равно (k*)^m

где m — количество подвекторов.

Однако я вообще не получаю k*! Я имею в виду, что при векторном квантовании мы присваиваем каждому вектору k центроидов. При квантовании продукции мы присваиваем каждому подвектору k центроидов. Как k* вступил в игру?


person gsamaras    schedule 14.07.2016    source источник


Ответы (1)


Я думаю, что k* — это количество центроидов в каждом подпространстве, а k — это количество центроидов во всем пространстве.

Например, если данные имеют размер 2d, например (x, y), и мы рассматриваем каждое измерение как подпространство и делаем kmeans, скажем, с k*=3 соответственно, мы получим 3 центроида в каждом подпространстве, {x1, x2, x3} и {y1, y2, y3}.

Тогда во всем пространстве будет 3^2=9 возможных центроидов, а именно* (x1, y1), (x1, y2), (x1, y3), (x2, y1)...

Таким образом, мы можем получить большое количество центроидов (в статье 2^64), используя небольшой объем памяти, потому что нам не нужно хранить все k*^m центроидов, нам нужно хранить только k* центроидов в каждом подпространстве.

Изменить:
В приведенном выше примере количество подпространств m=2, количество центроидов в каждом подпространстве k*=3, количество центроидов во всем подпространстве k=3^2, количество измерений каждого подпространства D*=1, количество плавающих точек для хранения mD*k*=Dk*=6.


*декартово произведение x и y

person dontloo    schedule 15.07.2016
comment
Таким образом, мы должны хранить m * k* центроидов в каждом подпространстве, верно? Или вы пропустили это, поскольку m = 1 в вашем примере (разве это не значение m в вашем примере)? Спасибо за ответ. :) - person gsamaras; 15.07.2016
comment
@gsamaras Я думаю, что это k* для каждого подпространства, всего mk*, как сказано внизу страницы 3. Вместо этого › мы храним центроиды m × k* всех субквантизаторов. - person dontloo; 15.07.2016
comment
О, пропустил это, да, конечно, это так, я согласен! Я также предполагаю, что да, m = 1 в вашем примере. - person gsamaras; 15.07.2016
comment
@gsamaras хм, я думаю, что в моем примере это m=2 (m - количество подпространств), потому что я использовал каждое измерение как подпространство. Возможно, вы имеете в виду D*=1 (D * - это размеры каждого подпространства). - person dontloo; 15.07.2016
comment
Точно! Возможно, вы захотите указать это в своем ответе, еще раз спасибо! - person gsamaras; 15.07.2016
comment
Я отправил последний соответствующий вопрос здесь, если у вас есть время, пожалуйста, посмотрите (обратите внимание, что это отличается от предыдущего комментария, сделанного 2 часа назад). - person gsamaras; 15.07.2016