Проблемы машинного обучения можно разделить на два основных типа:

Регрессия: когда нам нужно найти простую функциональную связь между входными функциями / переменными. Эта функциональная связь может быть некоторой математической функцией, а именно. полиномиальная функция. Например, данный набор данных включает функцию «Температуры» и метку «Потребляемая мощность». Задача машинного обучения - найти взаимосвязь между этими функциями для прогнозирования потребности в энергии при заданной температуре. Это пример простой линейной регрессии.

Классификация: когда нам нужно распределить данные образцы по классам или группам. Например, данный набор данных включает все виды животных с их физическими характеристиками и метками (рептилии, морские животные и т. д.), а задача ML состоит в том, чтобы классифицировать этих животных в соответствии с меткой и предсказать метку нового животного с заданными физическими характеристиками.

Некоторые обозначения

m: количество обучающих выборок.

x: входная переменная (функция)

y: выходная переменная (метка / цель)

(x (i), y (i)): с обучающей выборкой / наблюдением

Простая линейная регрессия

По названию темы можно предсказать, что линейная функция будет использоваться для определения связи между функцией и меткой для решения проблемы регрессии.

Следующие шаги можно использовать для реализации простой линейной регрессии:

Обучающие данные: данный набор данных можно разделить на обучающий, тестовый и проверочный. Как правило, 80% данных считается обучающим набором, а остальные 20% - тестовым набором.

Исследование данных и извлечение функций: я подготовлю отдельное руководство по исследованию данных, потому что более 60% задач в проекте машинного обучения - это исследование данных. Извлечение признаков также является частью исследования данных, и в основном это то, какие функции / входные данные будут использоваться для модели, например, в данных прогнозирования погоды, температуры, влажности, ветрового потока и т. Д., Поэтому, какие функции должны быть включены для прогнозирования.

Модель машинного обучения. Выбирается соответствующая модель машинного обучения, которую можно реализовать для решения проблемы.

Показатель качества: y - фактический результат, а ŷ - прогнозируемое значение. Для измерения качества можно рассчитать различные матрицы, такие как среднеквадратическая ошибка корня.

Пример:

Как показано на рисунке выше, количество линий можно подогнать под данные, но какая линия лучше всего подходит?

Ответ на этот вопрос - функция стоимости. Функция стоимости здесь - это остаточная сумма квадратов (RSS), где остаток - это расстояние между прогнозируемым значением и фактическим выходом.

Почему RSS, а не абсолютная сумма ошибок или остатков?

Чтобы подробно ответить на этот вопрос, нам нужно обсудить функцию градиента, которую мы обсудим в следующем уроке. Ответ на этот вопрос заключается в том, что RSS является выпуклой функцией, поэтому мы уверены, что будет одна точка минимума, которую можно легко вычислить с помощью градиентного спуска. Я обещаю, что этот ответ станет вам понятен, когда я расскажу о градиентном спуске.

На приведенном выше рисунке дается четкое описание того, как выглядит наиболее подходящая линия, и представлены ошибки. Уравнение задается следующим образом:

Здесь θ0 - точка пересечения по оси y, а θ1 - наклон. RSS представлен как:

Ссылки:

  1. Некоторые изображения и данные взяты из слайдов моего курса машинного обучения, преподаваемого в Западном университете.
  2. Ссылка на заглавное изображение: https://unsplash.com/photos/UdneLq-Qm10