Класификация на алгоритмите за машинно обучение

В последно време машинното обучение се счита за неразделна част от науката за данни, която може да се използва за изграждане на прогнозни модели. Във всеки механизъм или система за машинно обучение компютрите се научават да решават определени проблеми с масивни набори от данни и им се предоставят модели.

Машинното обучение също се определя като един от клоновете на компютърните науки, в който алгоритмите (работещи в компютрите) се учат от данни или набори от данни, достъпни за тях. С този механизъм за обучение изходът от тези различни механизми ще се използва за изграждане на прогнозни модели.

Системите за машинно обучение (или алгоритми) могат да бъдат широко класифицирани в много категории въз основа на различни фактори и методи. Най-популярните от тях са следните:

· Учене под наблюдение

· Учене без надзор

· Полуконтролирано обучение

· Учене с подсилване

· Онлайн/пакетно обучение

Учене под наблюдение:Тези алгоритми обикновено се обучават от човешки „надзор“. Това е причината да се наричат „алгоритми за контролирано обучение“. Повечето от данните за обучение, които се използват в алгоритмите за контролирано обучение, са „етикетирани“ данни. Може да се каже, че има „учител“, участващ в обучението на модела. „Означени данни“ тук означава, които са маркирани с още едно име, свързано с тях. Например изображение е етикетирано като снимка на котка и снимка на куче въз основа на характера и характеристиките на тази снимка. Това помага за по-късното класифициране и обучение на „немаркираните данни“ с по-нататъшна класификация и категоризация. Въз основа на определени характеристики тези етикети се предвиждат/предполагат. Веднъж предвидена, тази примерна група се обозначава с това име. Чрез непрекъснато предоставяне на входни данни, изходът се генерира, тези изходи не са нищо друго освен „етикети“. Обучението включваше различни видове масиви от данни и изграждане на модели.

Някои от добре познатите и широко използвани алгоритми за контролирано обучение са следните:

· Регресия (непрекъснати целеви променливи)

- Линейна регресия

- Логистична регресия

- Ансамбълни методи

- Дървета на решенията и произволни гори

- Поддържа векторна регресия (SVR)

- Регресия на Gaussian Process (GPR)

· Класификация (категорични целеви променливи)

- Поддържайте векторни машини (SVM)

- Наивен Байс

- K-най-близки съседи (KNN)

· Общи невронни мрежи

- Многослоен перцептрон (MLP)

Неконтролирано обучение: Тези алгоритми, както подсказва името, не се контролират от хора. Това означава, че данните за обучението са „немаркирани“. При неконтролирано обучение изобщо не участва учител. Това, което системата или компютърът научава, са различни модели/структури в данните. Въз основа на тези шаблони данните могат да бъдат групирани в модел като изходна категория. Въз основа на тези модели човек може да се натъкне на набор от правила, които по-късно могат да бъдат използвани за извличане на смислени прозрения. Тези алгоритми също могат да се използват за изграждане на описателно моделиране. Тези алгоритми, за разлика от контролираните, не предвиждат и не намират нищо специфично за набора от данни.

Някои от добре познатите и широко използвани алгоритми за обучение без надзор са следните:

· Групиране (непрекъснато) и размерност

- К-означава

- К-медоиди

- Йерархичен клъстерен анализ (HCA)

- Максимизиране на очакванията

- Скрит Марков модел

- Невронни мрежи

- PCA (Анализ на основните компоненти)

- СВД

- PCA на ядрото

- t-разпределено стохастично съседно вграждане (t-SNE)

- Локално линейно вграждане (LLE)

· Анализ на асоциацията (категоричен)

- Априори

- Еклат

- FP-растеж

Полу-контролирано обучение: За да категоризираме някои от алгоритмите, които попадат или като контролирани алгоритми ИЛИ като неконтролирани алгоритми, ИЛИ и двете, казваме, че попадат в полу-контролирано обучение. Така че, може да се каже така, или няма етикети за наблюдението в наборите от данни, или етикетите присъстват само за определени наблюдения. В някои случаи, когато етикетирането на данни е скъпо, но се нуждае от комбинация както от частично етикетиране на данни, така и от частично немаркиране, тези алгоритми могат да се използват.

Някои от добре познатите и широко използвани алгоритми за обучение без надзор са следните:

· Uclassify

· ПОРТА

Обучение с подсилване: Това днес е един от популярните механизми за обучение на алгоритъм. Много сложни модели се изграждат с помощта на комбинация от контролирано обучение или неконтролирано обучение заедно с подсилващи алгоритми. Това сама по себе си е различна категория, където така нареченият агент наблюдава околната среда, избира и извършва различни действия и съответно генерира награди или наказания.

· Q-Learning: Q-Learning е RL алгоритъм без модел, „Q“ в Q-Learning означава качество, което се използва, за да се определи колко полезно е дадено действие за получаване на някаква бъдеща награда.

· Времева разлика (TD): TD е подход за научаване как да се предвиди количество, което може да зависи от бъдещи стойности на даден сигнал.

· Мрежи с дълбоко състезание: Мрежите с дълбоко състезание, също понякога наричани DBN, са числени алгоритми с голяма паралелност.

· Процес на вземане на решения по Марков (MDP): MDP работи с помощта на методологията, включваща агент, среда, състояние и действие, всяко в зависимост от другото.

· Търсене в Монте Карло дърво: това е евристичен алгоритъм за търсене, използван за процеси на вземане на решения.

· Асинхронни актьорско-критични агенти (AAAC): този алгоритъм е полезен при експерименти, които включват някаква глобална мрежова оптимизация с различни среди паралелно за целите на обобщаването.

С колко сте работили? Кажете ни в секцията за коментари.

Класификация на алгоритмите за машинно обучение

Подобни въпроси