Има няколко добре известни мерки като ширина на силуета (SW), индекс на Davies-Bouldin (DB), индекс Calinski-Harabasz (CH) и индекс на Dunn. Как можем да кажем, че мярката за качество на клъстерирането е добра?
Има ли някаква метрика, за да бъде мярката за качество на клъстерирането добра?
Също ,
алгоритмите, които произвеждат клъстери с висок индекс на Dunn, са по-желани - Wikipedia
Обекти с висока стойност на силуета се считат за добре групирани - Уикипедия
алгоритъмът за клъстериране, който създава колекция от клъстери с най-малък индекс на Дейвис-Боулдин, се счита за най-добрият алгоритъм - Wikipedia
Колко високи или ниски трябва да бъдат тези стойности? Има ли метричен номер?
Може ли някой да ми даде малък пример с използване на мярка за качество на клъстериране върху набор от данни или IRIS набор от данни, за да кажа, че конкретната мярка за качество на клъстериране е добра?