Внедрение ELKI COPAC

Я попытался запустить реализацию COPAC ELKI на примере набора данных, представленного на официальном сайте (mouse.csv), но я получаю исключение NullPointerException, которое заставляет меня думать, что есть некоторые детали, которые я опускаю (позор мне).

Исключение составляет следующее:

Сбой задачи java.lang.NullPointerException в de.lmu.ifi.dbs.elki.database.ids.integer.DoubleDistanceIntegerDBIDPair.compareByDistance(неизвестный источник) в de.lmu.ifi.dbs.elki.distance.distanceresultlist.AbstractKNNHeap$Comp. сравните (неизвестный источник) в de.lmu.ifi.dbs.elki.distance.distanceresultlist.AbstractKNNHeap$Comp.compare(неизвестный источник) в de.lmu.ifi.dbs.elki.utilities.datastructures.heap.TopBoundedHeap.add( Неизвестный источник) в de.lmu.ifi.dbs.elki.database.query.knn.LinearScanRawDoubleDistanceKNNQuery.getKNNForObjectBenchmarked(Неизвестный источник) в de.lmu.ifi.dbs.elki.database.query.knn.LinearScanRawDoubleDistanceKNNQuery.getKNNForObject(Неизвестный источник) ) в de.lmu.ifi.dbs.elki.database.query.knn.LinearScanRawDoubleDistanceKNNQuery.getKNNForDBID(неизвестный источник) в de.lmu.ifi.dbs.elki.index.preprocessed.localpca.KNNQueryFilteredPCAIndex.objectsForPCA(неизвестный источник) в de.lmu.ifi.dbs.elki.index.preprocessed.localpca.KNNQueryFilteredPCAI ndex.objectsForPCA(неизвестный источник) в de.lmu.ifi.dbs.elki.index.preprocessed.localpca.AbstractFilteredPCAIndex.preprocess(неизвестный источник) в de.lmu.ifi.dbs.elki.index.preprocessed.localpca.AbstractFilteredPCAIndex. getLocalProjection(неизвестный источник) в de.lmu.ifi.dbs.elki.index.preprocessed.localpca.AbstractFilteredPCAIndex.getLocalProjection(неизвестный источник) в de.lmu.ifi.dbs.elki.algorithm.clustering.correlation.COPAC.run( Неизвестный источник) в sun.reflect.NativeMethodAccessorImpl.invoke0(собственный метод) в sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) в sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) в java.lang. Reflect.Method.invoke(Method.java:616) в de.lmu.ifi.dbs.elki.algorithm.AbstractAlgorithm.run(Неизвестный источник) в de.lmu.ifi.dbs.elki.workflow.AlgorithmStep.runAlgorithms(Неизвестно Источник) на [...]

Это настройка параметров, которые я использую:

-dbc.in [ПУТЬ ОПУЩЕН]/mouse.csv

-алгоритм кластеризации.корреляции.COPAC

-copac.preprocessor localpca.KNNQueryFilteredPCAIndex

-copac.partitionAlgorithm gdbscan.GeneralizedDBSCAN

-dbscan.epsilon 0.00400000

-dbscan.minpts 3

Кто-нибудь может дать мне некоторую информацию?


person Gibbster    schedule 12.03.2013    source источник


Ответы (1)


Вы должны указать параметр k для kNN Local PCA:

-localpca.k 10

в последней версии ELKI есть небольшая ошибка, из-за которой параметр неправильно помечен как необязательный. Это необязательно. Обратите внимание, что k должно быть значительно больше, чем размерность данных, чтобы давать стабильные результаты PCA.

Обратите внимание, что использование COPAC на низкоразмерном наборе данных, таком как пример с мышью, не имеет смысла.

person Erich Schubert    schedule 13.03.2013
comment
Я обнаружил это сегодня утром! Я запускал его на примере мышки после того, как опробовал на своем наборе данных... просто пытался понять, почему это не сработало. В любом случае спасибо за ответ, вы были очень добры и полезны! - person Gibbster; 13.03.2013