AI, ML, DL и аналитика - ключевые слова

В связи с тем, что мир становится цифровым, а весь шум вокруг данных является новой нефтью, мы часто слышим такие термины, как искусственный интеллект (AI), машинное обучение (ML), глубокое обучение (DL) и аналитика, и как это часто бывает В случае с модными словечками они часто используются взаимозаменяемо, в неправильном контексте и с небольшим пониманием их фактического значения.

В этой статье я хотел бы дать непрофессионалам обзор того, что означают эти термины, чем они отличаются и каковы типичные варианты использования каждого из них.

Искусственный интеллект (AI)

Начиная с самого широкого термина, ИИ - это технология, которая стремится имитировать человеческий интеллект или процесс принятия решений. Это общий термин для любой системы, которая принимает некоторые входные данные и возвращает некоторые обработанные выходные данные. Это может быть программный код 101, который просит пользователя ввести возраст и распечатывает, взрослый он или нет, до приложения, которое делает вашу фотографию и предсказывает, как вы будете выглядеть через 20 лет.

Эти решения можно принять двумя способами:

Алгоритмы на основе правил подразумевают определение набора правил, основанных на понимании проблемы для принятия решения, в отличие от машинного обучения, при котором мы передаем алгоритму много данных и позволяем ему определять правила. самостоятельно (подробнее об этом в следующем разделе).

Несмотря на то, что ML слишком популярен как высокотехнологичное или продвинутое решение, основанные на правилах методы в основном являются лучшим выбором для сценариев, в которых проблема хорошо изучена, параметры решения немногочисленны, а решение может быть выражено как набор если ‹this›, то правила ‹that› без особых изменений с течением времени или образцов.

Следует отметить, что данные не являются обязательными для алгоритмов, основанных на правилах. Таким образом, не весь ИИ управляется данными.

Машинное обучение

Машинное обучение - это подмножество ИИ, в котором вместо правил мы передаем алгоритму некоторые данные и позволяем ему определять существующие в нем шаблоны. В средствах массовой информации могло сложиться впечатление, что машинное обучение - это сложная наука о ракетостроении, но если вы когда-либо использовали регрессию в Excel или где-либо еще, поздравляю, вы внедрили машинное обучение.

Алгоритмы машинного обучения обнаруживают в данных множество «шаблонов». Для иллюстрации, взяв в качестве примера данные кредитной карты банка - демографические данные клиентов, транзакции, детали погашения и т. Д., Мы можем анализировать исторические данные, чтобы делать прогнозы на будущее, например, оценивая кредитный лимит для нового заявителя (регрессия), проверять, является ли новая транзакция мошеннической (классификация / обнаружение аномалий), группировать пользователей со схожим поведением для помощи в разработке стратегии (кластеризация) и т. д., упоминая некоторые из нескольких вариантов использования машинного обучения.

Глубокое обучение

Глубокое обучение - это разновидность машинного обучения, основанного на так называемых искусственных нейронных сетях. Хотя точная математика, стоящая за ними, довольно сложна, но их можно представить как несколько единиц регрессии, сложенных вместе. Это позволяет им извлекать гораздо более сложные закономерности в данных, и, таким образом, хотя машинное обучение в основном ограничено структурированными (или табличными) данными, глубокое обучение часто используется для неструктурированных данных (текст, изображения, звуки, видео и т. Д.) В качестве Что ж. Таким образом, для любого варианта использования текстовой аналитики (NLP, NLU, NLG и т. Д.) Или анализа изображений или видео используемые алгоритмы, скорее всего, будут использовать глубокое обучение.

(Боковое примечание: существует несколько методов компьютерного зрения и анализа текста без глубокого обучения, которые использовались традиционно, но с постоянно растущими массивами данных и дешевыми вычислениями, а также постоянными исследованиями и улучшениями в DL, использованием традиционных подходов постепенно ограничивается более простыми проблемами.)

Аналитика

Аналитика или данные Аналитика или анализ данных - это весь процесс получения информации из данных. Это включает в себя очистку, преобразование, исследование данных, а также формирование и проверку гипотез. После этих шагов на основе преобразованных данных могут быть очевидны выводы; или данные могут быть введены в алгоритмы машинного обучения для различных видов анализа.

Например, анализируя данные о количестве смертей от COVID-19 в день (источник), без использования машинного обучения, следующий график ясно дает представление об относительном количестве смертей, связанных с болезнями, и о том, что они снижение в США, Великобритании, Италии и Германии, но продолжает расти в Индии и Бразилии.

Данные после очистки также могут быть отправлены в алгоритм машинного обучения для другого анализа. Например, на графике ниже (исходная статья) автор попытался спрогнозировать уровни CO2 на основе исторических данных, используя алгоритм машинного обучения (SARIMA).

Или здесь, где автор проанализировал данные World Happiness Report и определил, какие характеристики являются наиболее важными для определения счастья жителей страны.

Вывод

Следовательно, для конечного варианта использования аналитики данных мы можем использовать алгоритмы искусственного интеллекта или машинного обучения, чтобы что-то предсказать или найти скрытые закономерности в данных, а результаты могут быть представлены с использованием визуализаций для более четкого представления понимания.

Надеюсь, это даст вам лучшее представление о том, что означают различные термины, и общее понимание их вариантов использования.