Моя последняя заметка рассматривала сигмовидную функцию как важный способ для моделей превращать входные данные в выходные данные между 1 и 0 для таких вещей, как предсказание и классификация.

На этой неделе мы рассмотрим модели классификации.

Классификация: «Что это за штука?»

Модели классификации нацелены на определение что-либо (к какому классу это относится?).

Чтобы показать, как они работают, мы рассмотрим простой пример с двумя характеристиками вещи, которую мы пытаемся классифицировать (x1 и x2), и тремя классами/типами вещей, которыми они могут быть (класс № 1, класс № 2). или класс №3).

Для каждого из этих классов наша классификационная модель будет иметь три разные функции гипотез (по одной для каждого класса), которые дадут вероятность того, что что-то относится к классу этой функции.

Первая функция гипотезы вычисляет вероятность того, что что-то относится к классу #1, вторая функция гипотезы вычисляет вероятность того, что что-то принадлежит классу #2, а третья функция гипотезы вычисление вероятности того, что что-то относится к классу #3.

Каждая из этих функций затем обучается отдельно, чтобы предсказать, принадлежит ли что-либо к определенному классу вещей.

Когда каждая функция гипотезы обучена, мы можем использовать наш набор функций гипотез, чтобы предсказать, к какому классу вещей принадлежит новая вещь.

Для этого:

  1. Каждая функция берет характеристики новой вещи и выводит вероятность ее принадлежности к определенному классу.
  2. Какая бы функция гипотезы ни давала ей наибольшую вероятность, это класс, который наша классификационная модель выберет в качестве нашего прогноза, к какому классу принадлежит новая вещь.

Допустим, функция гипотезы № 1 вычисляет вероятность 41 % того, что новая вещь относится к классу № 1, функция гипотезы № 2 вычисляет вероятность 73 % того, что новая вещь принадлежит классу № 2, а функция гипотезы № 3 вычисляет 22% вероятность того, что новая вещь относится к классу №3. Поскольку функция гипотезы № 2 вычисляет наибольшую вероятность на основе характеристик новой вещи, наша модель будет предсказывать, что новая вещь относится к типу вещей класса № 2.

Отзыв и точность

При разработке моделей классификации используются два ключевых показателя: отзыв и точность.

Отзыв – это количество истинно положительных результатов, деленное на количество всех положительных результатов (ложноотрицательные + истинно положительные результаты). Другими словами, припоминание измеряет, какой процент совокупности вещей определенного типа определяется вашей моделью как этот тип вещей? Вы можете представить себе ситуации, когда вам понадобится высокая метрика отзыва, например, классификация неисправных деталей в авиастроении.

Точность — это количество истинных срабатываний, деленное на количество истинных срабатываний + ложных срабатываний. Другими словами, точность измеряет, какой процент вещей, классифицированных вашей моделью как принадлежащих к определенному классу, на самом деле принадлежит к этому классу?

Обе метрики обычно важны. Если вы сосредоточитесь только на отзыве, вы можете просто создать модель, которая всегда выдает 100% вероятность, и она никогда не пропустит неисправную деталь самолета, но вы также никогда не построите самолет, потому что каждая деталь будет классифицироваться как неисправная.

Модели классификации с большим количеством входных и выходных данных

В нашем иллюстративном примере выше мы использовали только 2 функции в нашей модели классификации, но (и вы, вероятно, это предвидели) модели классификации в машинном обучении могут использовать бесконечное количество функций.

Наконец, в нашем примере наша модель использовала разные функции гипотез для каждого класса вещей, и каждая функция давала только один результат (то есть вероятность того, что что-то является конкретным классом вещей этой функции), но позже, когда мы рассмотрим нейронные сети , вы увидите, что у нейронной сети может быть несколько выходных данных, и поэтому она может выполнять работу нескольких отдельных функций, имея один выход для класса № 1, другой выход для класса № 2 и так далее.

Следующий:

В следующей заметке я рассмотрю проблему переоснащения моделей машинного обучения и рекомендации по ее предотвращению.

Прошлые сообщения в этой серии:

  1. На пути к глубокому пониманию машинного обучения
  2. Построение интуиции вокруг контролируемого машинного обучения с градиентным спуском
  3. Помогаем моделям обучения с учителем учиться лучше и быстрее
  4. Сигмовидная функция как концептуальное введение в функции активации и гипотезы