Я пытаюсь построить кривую ROC идентификатора, используемого для определения положительных инцидентов на фоне набора данных. Идентификатор - это список оценок вероятности с некоторым перекрытием между двумя группами.
FG BG
0.02 0.10
0.03 0.25
0.02 0.12
0.04 0.16
0.05 0.45
0.12 0.31
0.13 0.20
(где FG = положительный, а BG = отрицательный.)
Я строю кривую ROC, используя PRROC в R, чтобы оценить, насколько хорошо идентификатор классифицирует данные в правильную группу. Хотя существует четкое различие между значениями классификатора, полученными между положительными и отрицательными наборами данных, но мой текущий график ROC в R показывает низкое значение AUC. Мои оценки вероятности для положительных данных ниже, чем для фона, поэтому, если я переключаю классификацию и использую фон в качестве точек переднего плана, я получаю кривую AUC с высокими баллами, и я не на 100% понимаю, почему это так, какой график лучше всего использовать или был ли дополнительный шаг, который я пропустил перед анализом моих данных.
roc ‹- roc.curve (scores.class0 = FG, scores.class1 = BG, curve = T)
ROC curve
Area under curve:
0.07143
roc2 ‹- roc.curve (scores.class0 = BG, scores.class1 = FG, curve = T)
ROC curve
Area under curve:
0.92857