Я обучил задачу бинарной классификации (положительная и отрицательная) и имею модель .h5
. И у меня есть внешние данные (которые ни разу не использовались ни в обучении, ни в валидации). Всего имеется 20 образцов, принадлежащих к обоим классам.
preds = model.predict(img)
y_classes = np.argmax(preds , axis=1)
Предполагается, что приведенный выше код вычисляет вероятность (preds) и метки классов (0 или 1), если он был обучен с softmax в качестве последнего выходного слоя. Но preds — это только одно число между [0;1], а y_classes всегда равно 0.
Чтобы вернуться немного назад, модель оценивалась по средней AUC с площадью около 0,75. Я вижу, что вероятности этих 20 образцов в основном (17) находятся в диапазоне от 0 до 0,15, остальные - 0,74, 0,51 и 0,79.
Как мне сделать из этого вывод?
EDIT: 10 из 20 образцов для тестирования модели относятся к положительному классу, остальные 10 относятся к отрицательному классу. Все 10, принадлежащие поз. класс имеют очень низкую вероятность (0 - 0,15). 7 из 10 отрицательных классов имеют такую же низкую вероятность, только 3 из них (0,74, 0,51 и 0,79).
Вопрос: почему модель предсказывает выборки с такой низкой вероятностью, хотя ее AUC была гораздо выше?