Да знаете кои точки принадлежат към кой клъстер в DBSCAN

Трябва да използвам DBSCAN за групиране на коефициенти за залагане на футболни мачове.

Данните се състоят от:

ID, отбор домакин, отбор гост, дата, час, коефициенти за победа на домакините, коефициенти за равенство и коефициенти за победа на госта.

Имам нужда от коефициенти за победа на домакините, коефициенти за равенство и коефициенти за победа на гости за клъстерирането на DBSCAN, защото искам да намеря извънредни стойности, използвайки шумовия клъстер.

Въпреки това нямам начин да знам тези точки към кой запис са принадлежали.]

Работя с GNU R, за да използвам алгоритъма, използвайки пакета fpc


person Steven Gatt    schedule 11.05.2015    source източник
comment
Реализацията на R fpc е наистина ограничена, за съжаление.   -  person Has QUIT--Anony-Mousse    schedule 12.05.2015
comment
Това означава ли, че това, което моля, не може да бъде направено?   -  person Steven Gatt    schedule 12.05.2015
comment
Разбира се, че може, но може да се наложи да разгледате, разберете и оптимизирате източника.   -  person Has QUIT--Anony-Mousse    schedule 12.05.2015


Отговори (1)


От псевдокода DBSCAN:

add P to cluster C

В този момент трябва да съхраните кои точки принадлежат на кой клъстер, очевидно; в каквато структура от данни предпочитате (може да бъде набор или масив за присвояване на клъстер).

person Has QUIT--Anony-Mousse    schedule 11.05.2015