Проблеми с прогнозирането

Машинно обучение срещу алгоритми

Основна цел и на двете: дефиниране на процедура за желано поведение на iвход-изход

Алгоритми: дефинирайте точно съпоставяне на вход към изход
напр. вход: график G, с върхове v и ръбове e
изход: най-краткият път междудве върхове i и j,вG
Машинно обучение: машината сама научава подходящо картографиране на вход към изход с помощта на двойки данни от (вход,изход)
напр. вход: изображение на ръкописна цифра
изход: числовата стойност

Входове и изходи
Основна терминология:

Интервал за въвеждане, X:
напр. 28px × 28px изображение на ръкописна цифра

Изходно пространство, Y:
напр. числовата стойност за цифра във входното изображение (2 за горния пример).

След като видите куп примери (X,Y), изберете съпоставяне f : x → y, което дава желаното входно-изходно поведение.

В зависимост от изходното пространство проблемът с предвиждането има следните категории:

Отделен
Непрекъснато
Вероятност

Дискретно изходно пространство: класификация
Двоична класификация: Откриване на спам
X = {имейл съобщение}
Y = {спам, не-спам}
Многоклас: Класификация на новинарски статии
X = {новинарска статия}
Y = {политика, спорт,…}
Структурен изход: Анализ
X = {изречение}
Y = {парс дърво}

Пространство за непрекъснат изход: Регресия
Прогнозиране на ниво на замърсяване: прогнозиране на утрешното качество на въздуха
Y = [0,∞) (‹ 100 добре, › 100 опасно )
Прогнозиране на продължителността на живота: изчисление на застрахователната компания
Y = [0,120]

Какво може да бъде подходящо X за горния случай на регресия?

Оценка на вероятността
Класифициране на онлайн транзакция като измамнаилиистинска
X =подробности за транзакцията
Y =[0,1], вероятността тази транзакция да е измамна

Защо не използвахме двоична класификация за класификация на транзакция?

Проблеми с прогнозирането

Подобни въпроси