4 от известните модни думи на 21-ви век и тяхната разлика

Какви са тези съкращения?

  • AI: Изкуствен интелект
  • ML: Машинно обучение
  • DL: Дълбоко обучение
  • DS: Наука за данни

Какви са всички тези неща?

Нека разберем!

Какво е изкуствен интелект?

Според Wikipedia, дефиницията на AI:

Изкуственият интелект (AI) е интелектът, демонстриран от машини, за разлика от естествения интелект, демонстриран от животни, включително хора.

Нека опростим това -

AI е способността на машина или компютърна програма да мисли, действа и учи като хората.

AI може да се класифицира най-общо в 2 типа:

  1. Тесен AI: Специфична задача (самоходни коли, чат-ботове и др.)
  2. Общ AI: Общо предназначение (като роботи, които виждаме във филмите, сериалите)

Все още не сме постигнали технологията (общ AI), която може да реши различни проблеми с широчина и гъвкавост, подобни на човешкия/естествения интелект.

Какво е машинно обучение?

Според Уикипедия:

Машинното обучение (ML) е изследване на компютърни алгоритми, които могат да се подобряват автоматично чрез опит и чрез използване на данни.

Нека го разберем с пример -

Да приемем, че ученик (машина), който учи в училище/колеж, се учи чрез книги/бележки (данни за обучение), използвайки различни техники (алгоритми), или разработени от него, или копирани от други/преподаватели, или комбиниращи 2 или повече техники. След това той дава тест за преразглеждане на примерните документи с отговори под ръка (данни за валидиране), за да се представи по-добре на финалния изпит (данни от теста).

Машинното обучение може да бъде класифицирано в три типа:

  1. Надгледано и полуконтролирано обучение – Когато подадените данни са заедно с целеви етикети
  2. Неконтролирано обучение — Когато подадените данни не съдържат целеви етикет
  3. Обучение с подсилване — различно от останалите; работи точно като човек, наблюдава контекста, изпълнява задачи и бива награждаван, ако се прави правилно, и наказва, ако се прави неправилно. Учи се от грешките си извънредно време и се опитва да ги поправи с Стратегия, за да спечели НАГРАДИ!

Какво е Deep Learning?

Дълбокото обучение е подмножество на машинното обучение, наричано още задълбочено разбиране на машинното обучение. То включва обучение на изкуствени невронни мрежи, което е приблизително копие на човешкия мозък и нервната система като цяло, за да накара машините да мислят и работят точно като хора. То включва създаване на изкуствени неврони, които действат като основни градивни елементи на Deep Learning.

Изкуственият неврон (перцептрон) работи по същия начин като биологичния неврон. Когато данните/сигналите се подават към неврон, той ги обработва, като намира модели, дешифрира информацията, опитва се да минимизира загубата и дава задоволителен резултат.

Дълбокото обучение има обхват за ефективно решаване на по-голямо разнообразие от проблеми при определени важни условия, като -

  1. Големи количества данни — изисква обучение върху огромни набори от данни, за да се постигнат добри резултати
  2. Създаване на по-големи, сложни модели — големите модели дават по-добри резултати, но действат като черна кутия (няма представа как моделът стига до резултатите)
  3. Огромна изчислителна мощност — за обучение на тези големи и сложни модели.

Дълбокото обучение може да се раздели на:

  1. ANN (Изкуствени невронни мрежи) — използва се за решаване на задачи, свързани с числени данни
  2. CNN (Конволюционни невронни мрежи) — използва се за решаване на задачи, свързани с данни за изображения
  3. RNN (повтарящи се невронни мрежи) — използва се за решаване на задачи, свързани с текстови или времеви серии от данни

Някои от приложенията на DL са:

  • Разпознаване на лица 🧐
  • Класификация на изображението/откриване на обект 🔍
  • Snapchat филтри 👻
  • Самоуправляващи се коли 🚗

и още!

Какво е Data Science?

Наука за данни = AI + ML + DL + Math/Stats + Domain Knowledge + Computer Science/Programming

Според Уикипедия:

Науката за данни е интердисциплинарна област, която използва научни методи, процеси, алгоритми и системи за извличане на знания и прозрения от шумни, структурирани и неструктурирани данни и прилагане на знания и практически прозрения от данни в широк спектър от приложения домейни.

Накратко…

Data Science е терминът за цял набор от инструменти и техники за анализиране на данни и извличане на прозрения от тях. Целта му е да открие скрити модели в необработените данни, за да помогне на бизнеса да подобри и увеличи печалбите си.

Стана модна дума през 2012 г., когато Harvard Business Review нарече:

Data Scientist: Най-сексапилната работа на 21-ви век

Жизненият цикъл на науката за данните

Проектите за наука за данни започват с откриване на проблеми/разбиране на бизнеса, след това събиране и предварителна обработка на данни въз основа на проблема. След подготовката на данните, ние се опитваме да разберем тяхното разпространение с помощта на EDA (Exploratory Data Analysis) и създаваме модели, готови за производство, използвайки тези разбирания.

AI vs ML vs DL vs DS

  • Изкуственият интелект (AI) е това, което започна всичко и има много неща в тази област, които тепърва ще постигнем като General AI.
  • Машинното обучение (ML) е подмножество от AI, което дава на машините способността да учат чрез обучение на алгоритми с огромни количества данни. Това е чудесно за правене на прогнози без изрично писане на милиони редове код.
  • Дълбокото обучение (DL) е подход към машинното обучение, който прави възможни високоефективни модели (невронни мрежи), използващи големи количества данни.
  • И накрая Data Science (DS) е комбинация от трите заедно със статистика и знания за домейни. Това е област, занимаваща се с извличане на прозрения от данни за подобряване на бизнеса и решаване на проблеми от реалния свят. DS винаги включва човек (за разлика от AI, където AI е този, който предприема действието).

TL;DR

Заключение

Данните могат да бъдат намерени навсякъде и количеството цифрови данни нараства с бързи темпове. За много компании е трудно да поддържат и да получават информация от тези огромни количества данни и това е мястото, където ние, специалистите по данни, блестим.

Цитат от Mike Loukides, Автор:

Проблемът не е в намирането на данни, а в измислянето какво да се прави с тях.