Машинно обучение срещу алгоритми

Основна цел и на двете: дефиниране на процедура за желано поведение на iвход-изход

  • Алгоритми: дефинирайте точно съпоставяне на вход към изход
    напр. вход: график G, с върхове v и ръбове e
    изход: най-краткият път междудве върхове i и j,вG
  • Машинно обучение: машината сама научава подходящо картографиране на вход към изход с помощта на двойки данни от (вход,изход)
    напр. вход: изображение на ръкописна цифра
    изход: числовата стойност

Входове и изходи
Основна терминология:

  • Интервал за въвеждане, X:
    напр. 28px × 28px изображение на ръкописна цифра

  • Изходно пространство, Y:
    напр. числовата стойност за цифра във входното изображение (2 за горния пример).

След като видите куп примери (X,Y), изберете съпоставяне f : x → y, което дава желаното входно-изходно поведение.

В зависимост от изходното пространство проблемът с предвиждането има следните категории:

  1. Отделен
  2. Непрекъснато
  3. Вероятност

Дискретно изходно пространство: класификация
Двоична класификация: Откриване на спам
X = {имейл съобщение}
Y = {спам, не-спам}
Многоклас: Класификация на новинарски статии
X = {новинарска статия}
Y = {политика, спорт,…}
Структурен изход: Анализ
X = {изречение}
Y = {парс дърво}

Пространство за непрекъснат изход: Регресия
Прогнозиране на ниво на замърсяване: прогнозиране на утрешното качество на въздуха
Y = [0,∞) (‹ 100 добре, › 100 опасно )
Прогнозиране на продължителността на живота: изчисление на застрахователната компания
Y = [0,120]

Какво може да бъде подходящо X за горния случай на регресия?

Оценка на вероятността
Класифициране на онлайн транзакция като измамнаилиистинска
X =
подробности за транзакцията
Y =
[0,1], вероятността тази транзакция да е измамна

Защо не използвахме двоична класификация за класификация на транзакция?