Глава 1. Введение в машинное обучение

В этой главе представлено введение в машинное обучение, включая его историю, определение и приложения. Машинное обучение — это область компьютерных наук, которая дает компьютерам возможность учиться без явного программирования. Это делается путем подачи компьютерных данных и предоставления ему возможности находить закономерности в данных. Как только компьютер находит эти закономерности, он может использовать их для прогнозирования новых данных.

Машинное обучение имеет широкий спектр приложений, включая фильтрацию спама, обнаружение мошенничества и распознавание изображений. Он также используется в ряде других областей, таких как здравоохранение, финансы и транспорт.

Бесплатно получите книгу Оливера Теобальда «Машинное обучение для начинающих»

Глава 2. Обучение под наблюдением

Обучение с учителем — это тип машинного обучения, при котором компьютер получает помеченные данные. Это означает, что данные уже классифицированы по категориям, таким как спам или не спам, исправные или нездоровые. Затем компьютер учится классифицировать новые данные, используя помеченные данные в качестве ориентира.

Существует два основных типа алгоритмов обучения с учителем: алгоритмы регрессии и алгоритмы классификации. Алгоритмы регрессии используются для прогнозирования непрерывных значений, таких как цена дома или рост человека. Алгоритмы классификации используются для прогнозирования категориальных значений, например, является ли электронное письмо спамом или нет, или есть ли у пациента заболевание или нет.

Глава 3. Неконтролируемое обучение

Неконтролируемое обучение — это тип машинного обучения, при котором компьютеру не предоставляются помеченные данные. Это означает, что компьютер должен самостоятельно находить закономерности в данных. Неконтролируемое обучение часто используется для таких задач, как кластеризация и уменьшение размерности.

Кластеризация — это задача группировки похожих точек данных вместе. Снижение размерности — это задача по уменьшению количества признаков в наборе данных при сохранении как можно большего количества информации.

Глава 4. Обучение с подкреплением

Обучение с подкреплением — это тип машинного обучения, при котором компьютер учится методом проб и ошибок. Компьютер получает вознаграждение за выполнение действий, которые приводят к желаемым результатам, и штраф за действия, которые приводят к нежелательным результатам. Затем компьютер учится предпринимать действия, которые максимизируют его вознаграждение.

Обучение с подкреплением часто используется для таких задач, как игры и управление роботами.

Глава 5. Показатели оценки

В машинном обучении важно оценивать производительность модели. Это делается с помощью показателей оценки. Метрики оценки измеряют точность, воспроизводимость, полноту и балл F1 модели.

Точность — это процент прогнозов, которые модель делает правильно. Точность — это процент положительных прогнозов, сделанных моделью, которые на самом деле являются положительными. Напомним — это процент положительных примеров, которые модель правильно идентифицирует. Оценка F1 представляет собой средневзвешенное значение точности и полноты.

Бесплатно получите книгу Оливера Теобальда «Машинное обучение для начинающих»

Глава 6. Предвзятость и отклонение

В машинном обучении есть два основных источника ошибок: предвзятость и дисперсия. Смещение — это ошибка, возникающая, когда модель делает прогнозы, которые систематически неверны. Дисперсия — это ошибка, возникающая, когда модель делает прогнозы, сильно отличающиеся от обучающих данных.

Модель с высоким смещением будет делать последовательные ошибки, но ошибки будут небольшими. Модель с высокой дисперсией будет делать случайные ошибки, но ошибки будут большими. Цель машинного обучения — найти модель с низким смещением и низкой дисперсией.

Глава 7. Регуляризация

Регуляризация — это метод, используемый для уменьшения дисперсии модели. Это делается путем добавления штрафа к целевой функции модели. Штраф предназначен для того, чтобы воспрепятствовать модели вносить большие изменения в ее веса.

Существует два основных типа регуляризации: регуляризация L1 и регуляризация L2. Регуляризация L1 добавляет штраф к сумме абсолютных значений весов модели. Регуляризация L2 добавляет штраф к сумме квадратов значений весов модели.

Глава 8. Настройка гиперпараметров

Гиперпараметры — это параметры модели машинного обучения, которые не извлекаются из данных. Эти параметры должны быть установлены пользователем.

Процесс поиска лучших гиперпараметров для модели называется настройкой гиперпараметров. Это можно сделать вручную или с помощью алгоритма настройки гиперпараметров.

Глава 9. Развертывание модели

После обучения модели машинного обучения ее необходимо развернуть, чтобы ее можно было использовать для прогнозирования. Это можно сделать, развернув модель на сервере или сделав модель доступной в виде веб-службы.

Глава 10. Заключение

Эта книга представляет собой введение в машинное обучение. Машинное обучение — это мощный инструмент, который можно использовать для решения самых разных задач. Если вы хотите узнать больше о машинном обучении, в Интернете и в библиотеках доступно множество ресурсов.

Бесплатно получите книгу Оливера Теобальда «Машинное обучение для начинающих»