Започване с машинно обучение🤖 (Ден 1)

Според Артър Самуел „алгоритмите за машинно обучение позволяват на компютрите да се учат от данни и дори да се подобряват, без да бъдат изрично програмирани“.

Машинното обучение (ML) е категория алгоритъм, който позволява на софтуерните приложения да станат по-точни при прогнозиране на резултатите, без да бъдат изрично програмирани. Основната предпоставка на машинното обучение е да се изградят алгоритми, които могат да получават входни данни и да използват статистически анализ, за да предскажат изход, като същевременно актуализират изходите, когато новите данни станат достъпни.

Машинното обучение се използва и от физици, не само от ИТ момчета в самоуправляващите се коли, системата за препоръчване на филми с разпознаване на лица и какво ли още не.

Използва се от физиците в смисъл, че те обикновено започват с големи масиви от данни за частиците, които създават в детектор, и използват ML, за да идентифицират десет или една минути, което им помага да спечелят благородни награди 🏆.

ML алгоритмите могат да бъдат класифицирани основно в зависимост от наличието/отсъствието на целеви променливи.

Контролирано обучение: [Целта е налице]
Машината се учи, използвайки етикетирани данни. Моделът се обучава на съществуващ набор от данни, преди да започне да взема решения с новите данни. Самоуправляващите се автомобили са добър пример за контролирано обучение.
Целевата променлива е непрекъсната (когато изходната променлива е реална стойност, като „долари“ или „тегло“) : Линейна Регресия, полиномна регресия, квадратична регресия.
Целевата променлива е категорична (когато изходната променлива е категория, като например „червено“ или „синьо“ или „болест“ и „няма болест“): Логистична регресия, Naive Bayes, KNN, SVM, дърво на решенията, градиентно усилване, ADA усилване, пакетиране, произволна гора и др.
Неконтролирано обучение: [Целта липсва]
Машината се обучава на немаркирани данни и без никакви подходящи насоки. Той автоматично извежда модели и връзки в данните чрез създаване на клъстери. Моделът се учи чрез наблюдения и изведени структури в данните. Генетика, например групиране на ДНК модели за анализ на еволюционната биология.
Анализ на главните компоненти, Факторен анализ, Декомпозиция на единични стойности и др.
Обучение с подсилване:
Моделът се учи чрез метод на проба и грешка. Този вид обучение включва агент, който ще взаимодейства със средата, за да създава действия и след това да открива грешки или награди от това действие. Това е като да останете на изолиран остров, където трябва да изследвате околната среда и да се научите как да живеете и да се адаптирате към условията на живот сами.

Въведение в Google Colab

Или можем да използваме google Colab, или можем да инсталираме Anaconda, която ще инсталира всички библиотеки на Python, които са необходими заедно в нашето пътуване с машинно обучение. Използвам Anaconda 🐍 :)

Google Colab има функции, които ви помагат да редактирате документи по същия начин, по който работите с Google Документи. Colab поддържа много популярни библиотеки за машинно обучение от високо ниво, които могат лесно да бъдат заредени във вашия бележник. Освен това предоставя безплатна облачна услуга с безплатни GPU и TPU

За да започнете да работите с Colab, първо трябва да влезете в акаунта си в Google, след което отидете на тази връзка https://colab.research.google.com.
При отваряне на уебсайта ще видите изскачащ прозорец съдържащ следните раздели:

Примери, Скорошни, Google диск, GitHub, Качване

В противен случай можете да създадете нов бележник на Jupyter, като щракнете върху Нов бележник на Python3 или Нов бележник на Python2 в долния десен ъгъл.

При създаването на нов бележник той ще създаде бележник на Jupyter с Untitled0.ipynb и ще го запише на вашия google диск в папка с име Colab Notebooks. Сега, тъй като по същество това е бележник на Jupyter, всички команди на тетрадките на Jupyter ще работят тук. Все пак можете да разгледате подробностите в „Първи стъпки с Jupyter Notebook.“

Въведение в NumPy

NumPy е пакет на Python. Това означава „числов Python“. Това е библиотека, състояща се от обекти с многомерен масив и колекция от процедури за обработка на масив. „Документация“ на NumPy.

Но защо NumPy, когато имаме списъци в Python, защото NumPy масивите са по-бързи и по-компактни от списъците на Python.

pip инсталирайте numpy

!pip инсталирайте numpy (в google colab)

Да се свържем LinkedIn, Twitter. Ще се видим! 👋

Започване с машинно обучение🤖 (Ден 1)

Въведение в Google Colab

Въведение в NumPy

Подобни въпроси