Знание, какие точки принадлежат какому кластеру в DBSCAN

Мне нужно использовать DBSCAN для кластеризации ставок на футбольные матчи.

Данные состоят из:

Идентификационный номер, домашняя команда, гости, дата, время, шансы на победу хозяев, шансы на ничью и шансы на победу на чужом поле.

Мне нужны шансы выигрыша дома, шансы ничьей и шансы выигрыша в гостях для кластеризации DBSCAN, потому что я хочу найти выбросы с помощью шумового кластера.

Однако у меня нет возможности узнать те точки, к какой записи они принадлежали.]

Я работаю с GNU R, чтобы использовать алгоритм, используя пакет fpc


person Steven Gatt    schedule 11.05.2015    source источник
comment
К сожалению, реализация R fpc действительно ограничена.   -  person Has QUIT--Anony-Mousse    schedule 12.05.2015
comment
Означает ли это, что то, о чем я прошу, невозможно?   -  person Steven Gatt    schedule 12.05.2015
comment
Конечно, может, но вам может потребоваться изучить, понять и оптимизировать исходный код.   -  person Has QUIT--Anony-Mousse    schedule 12.05.2015


Ответы (1)


Из псевдокода DBSCAN:

add P to cluster C

На этом этапе, очевидно, вы должны сохранить, какие точки принадлежат какому кластеру; в любой структуре данных, которую вы предпочитаете (это может быть набор или массив назначения кластера).

person Has QUIT--Anony-Mousse    schedule 11.05.2015