Я думаю, что k*
— это количество центроидов в каждом подпространстве, а k
— это количество центроидов во всем пространстве.
Например, если данные имеют размер 2d, например (x, y)
, и мы рассматриваем каждое измерение как подпространство и делаем kmeans, скажем, с k*=3
соответственно, мы получим 3 центроида в каждом подпространстве, {x1, x2, x3}
и {y1, y2, y3}
.
Тогда во всем пространстве будет 3^2=9
возможных центроидов, а именно* (x1, y1)
, (x1, y2)
, (x1, y3)
, (x2, y1)
...
Таким образом, мы можем получить большое количество центроидов (в статье 2^64
), используя небольшой объем памяти, потому что нам не нужно хранить все k*^m
центроидов, нам нужно хранить только k*
центроидов в каждом подпространстве.
Изменить:
В приведенном выше примере количество подпространств m=2
, количество центроидов в каждом подпространстве k*=3
, количество центроидов во всем подпространстве k=3^2
, количество измерений каждого подпространства D*=1
, количество плавающих точек для хранения mD*k*=Dk*=6
.
*декартово произведение x и y
person
dontloo
schedule
15.07.2016