Машинно обучение срещу алгоритми
Основна цел и на двете: дефиниране на процедура за желано поведение на iвход-изход
- Алгоритми: дефинирайте точно съпоставяне на вход към изход
напр. вход: график G, с върхове v и ръбове e
изход: най-краткият път междудве върхове i и j,вG - Машинно обучение: машината сама научава подходящо картографиране на вход към изход с помощта на двойки данни от (вход,изход)
напр. вход: изображение на ръкописна цифра
изход: числовата стойност
Входове и изходи
Основна терминология:
- Интервал за въвеждане, X:
напр. 28px × 28px изображение на ръкописна цифра
- Изходно пространство, Y:
напр. числовата стойност за цифра във входното изображение (2 за горния пример).
След като видите куп примери (X,Y), изберете съпоставяне f : x → y, което дава желаното входно-изходно поведение.
В зависимост от изходното пространство проблемът с предвиждането има следните категории:
- Отделен
- Непрекъснато
- Вероятност
Дискретно изходно пространство: класификация
Двоична класификация: Откриване на спам
X = {имейл съобщение}
Y = {спам, не-спам}
Многоклас: Класификация на новинарски статии
X = {новинарска статия}
Y = {политика, спорт,…}
Структурен изход: Анализ
X = {изречение}
Y = {парс дърво}
Пространство за непрекъснат изход: Регресия
Прогнозиране на ниво на замърсяване: прогнозиране на утрешното качество на въздуха
Y = [0,∞) (‹ 100 добре, › 100 опасно )
Прогнозиране на продължителността на живота: изчисление на застрахователната компания
Y = [0,120]
Какво може да бъде подходящо X за горния случай на регресия?
Оценка на вероятността
Класифициране на онлайн транзакция като измамнаилиистинска
X =подробности за транзакцията
Y =[0,1], вероятността тази транзакция да е измамна
Защо не използвахме двоична класификация за класификация на транзакция?