Проблемы машинного обучения можно разделить на два основных типа:
Регрессия: когда нам нужно найти простую функциональную связь между входными функциями / переменными. Эта функциональная связь может быть некоторой математической функцией, а именно. полиномиальная функция. Например, данный набор данных включает функцию «Температуры» и метку «Потребляемая мощность». Задача машинного обучения - найти взаимосвязь между этими функциями для прогнозирования потребности в энергии при заданной температуре. Это пример простой линейной регрессии.
Классификация: когда нам нужно распределить данные образцы по классам или группам. Например, данный набор данных включает все виды животных с их физическими характеристиками и метками (рептилии, морские животные и т. д.), а задача ML состоит в том, чтобы классифицировать этих животных в соответствии с меткой и предсказать метку нового животного с заданными физическими характеристиками.
Некоторые обозначения
m: количество обучающих выборок.
x: входная переменная (функция)
y: выходная переменная (метка / цель)
(x (i), y (i)): с обучающей выборкой / наблюдением
Простая линейная регрессия
По названию темы можно предсказать, что линейная функция будет использоваться для определения связи между функцией и меткой для решения проблемы регрессии.
Следующие шаги можно использовать для реализации простой линейной регрессии:
Обучающие данные: данный набор данных можно разделить на обучающий, тестовый и проверочный. Как правило, 80% данных считается обучающим набором, а остальные 20% - тестовым набором.
Исследование данных и извлечение функций: я подготовлю отдельное руководство по исследованию данных, потому что более 60% задач в проекте машинного обучения - это исследование данных. Извлечение признаков также является частью исследования данных, и в основном это то, какие функции / входные данные будут использоваться для модели, например, в данных прогнозирования погоды, температуры, влажности, ветрового потока и т. Д., Поэтому, какие функции должны быть включены для прогнозирования.
Модель машинного обучения. Выбирается соответствующая модель машинного обучения, которую можно реализовать для решения проблемы.
Показатель качества: y - фактический результат, а ŷ - прогнозируемое значение. Для измерения качества можно рассчитать различные матрицы, такие как среднеквадратическая ошибка корня.
Пример:
Как показано на рисунке выше, количество линий можно подогнать под данные, но какая линия лучше всего подходит?
Ответ на этот вопрос - функция стоимости. Функция стоимости здесь - это остаточная сумма квадратов (RSS), где остаток - это расстояние между прогнозируемым значением и фактическим выходом.
Почему RSS, а не абсолютная сумма ошибок или остатков?
Чтобы подробно ответить на этот вопрос, нам нужно обсудить функцию градиента, которую мы обсудим в следующем уроке. Ответ на этот вопрос заключается в том, что RSS является выпуклой функцией, поэтому мы уверены, что будет одна точка минимума, которую можно легко вычислить с помощью градиентного спуска. Я обещаю, что этот ответ станет вам понятен, когда я расскажу о градиентном спуске.
На приведенном выше рисунке дается четкое описание того, как выглядит наиболее подходящая линия, и представлены ошибки. Уравнение задается следующим образом:
Здесь θ0 - точка пересечения по оси y, а θ1 - наклон. RSS представлен как:
Ссылки:
- Некоторые изображения и данные взяты из слайдов моего курса машинного обучения, преподаваемого в Западном университете.
- Ссылка на заглавное изображение: https://unsplash.com/photos/UdneLq-Qm10