Защо решенията за машинно обучение са трудни за внедряване без операции с машинно обучение?

Според Gartner 85% от решенията за машинно обучение се провалят, защото използват необработени данни. Учените по данни работят изолирано от специалистите по операции и предприятията „прекарват“ до три месеца в внедряване на ML модел. За да разрешат тези проблеми и да намалят времето за внедряване, компаниите за разработка на DevOps включват специалисти по MLOps в своите проекти. В тази статия ще ви кажем какво е MLOps и защо бизнесът трябва да внедри решения за машинно обучение.

MLOps като нов формат на работа

Стандартният жизнен цикъл на разработка на софтуер (SDLC) включва дефиниране на изисквания, проектиране, разработка, тестване и внедряване.

С нарастването на популярността на ML и AI почти всяка компания включва гласови асистенти, чатботове, технологии за компютърно зрение и т.н. в своите приложения. Новите продуктови изисквания и промените в SDLC насърчават организациите да използват MLops в своите CI/CD.

MLOps е иновативен формат за работа между специалисти по данни и специалисти по операции. Подобно на DevOps, той има за цел да автоматизира цикъла на разработка на ML модела, така че преходът от тестване на модела към пускане в производствена среда да се извършва автоматично.

MLOps отговаря за гарантирането, че всички промени в даден алгоритъм се тестват автоматично и се внедряват, дори когато алгоритъмът за ML е в производство.

Жизненият цикъл на ML моделите включва следните етапи:

формулиране на бизнес идея;
създаване на модел за машинно обучение;
тестване и внедряване на модела в бизнес процеса;
използване на модела.

Особености на работния процес на MLOps

Работният процес се основава на цикъла на разработка на ML модел. В него участват няколко отбора:

бизнес анализатори определят стойността, която моделът на машинно обучение ще донесе на бизнеса;
изследователите на данни събират и подготвят информация, въз основа на която се проектират ML решения;
Инженерите на MLOps пишат кода за модела за машинно обучение;
Специалистите по DevOps отговарят за внедряването и наблюдението на модели в производствена среда.

Учените по данниизмислят подход за машинно обучение за решаване на бизнес проблеми. Те определят кои алгоритми и техните комбинации са необходими за обучение на модела и как да се оцени тяхното качество. Като резултат те получават аналитичен доклад, който служи като документация за проекта с описания, ясна структура и примери. Този доклад дава ясно разбиране за това как самообучаващите се алгоритми решават бизнес проблем.

Учен по данни съобщава изискванията на разработчиците и специалистите по DevOps. С всеки от тях те обсъждат как да превърнат изискванията в ясен, автоматизиран, версионен ML тръбопровод, който е лесно мащабируем и включва обратна връзка, мониторинг и докладване. Всеки отдел работи със своята част от изискванията и измисля как да ги приложи на практика.

Това е доста сложна картина. Комуникацията между отделите обаче става по-лесна, когато около проекта е изградена рамка, а тръбопроводът, част от мониторинга и интеграцията са автоматизирани. Новите версии на модела излизат по-бързо.

На какво се основава MLOps?

MLOps включва следните компоненти:

Тръбопровод за модел на обучение. Данните се извличат и обработват, така че моделът да има върху какво да тренира. Обучен модел се тества, за да се разбере неговата готовност за внедряване.

Моделен регистър. Нов модел се регистрира преди да бъде пуснат в производство.

Внедряване на модел на IoT устройство, в приложение или специална уеб услуга.

Наблюдение на модел. Инженерите на MLOps анализират производителността на модела. Когато забележат, че моделът започва да работи неточно, го изпращат на преквалификация.

CI/CD оркестрация. CI/CD инструментите прилагат набор от обучение, тестване и внедряване на модели.

Така че, точно като DevOps услугите, MLOps се управлява от методологии за непрекъснато доставяне, обучение и интеграция. Работният процес на MLOps се различава от проект до проект. Зависи от бизнес целите на даден продукт, сложността на ML модела, размера на организацията и други условия.

Сравнете подобни практики: MLOps, DevOps и DataOps

Процесът MLOps определя машинното обучение. Той е различен от подобни DevOps и DataOps.

Справедливо е да се каже, че MLOps е DevOps за машинно обучение, но те се различават значително. MLOps се нуждае от инструменти за запазване на данни и версии на модели, за да ги тества и преобучава. Моделът постепенно се влошава, така че трябва постоянно да наблюдавате поведението му. Тестването в MLOps означава непрекъснато обучение и проверка на модела.

DataOps е основно отговорен за жизнения цикъл на данните. Може да е част от MLOps, но не управлява жизнения цикъл на модела.

Как MLOps допринася за успеха на бизнеса

За да визуализираме как MLOps „помага“ на бизнеса, нека вземем прост пример. Онлайн магазин иска да автоматизира чат за комуникация с клиенти. Без MLOps, ботът ще отговаря на въпроси на клиенти въз основа на конкретно диалогово дърво, а ефективността на такава автоматизация е ниска — 20–30%.

По-ефективно е да се внедри AI модул, разработен с помощта на MLOps. То ще може да:

отговори на 60–70% повече въпроси;
„разбират“ нестандартни клиентски заявки;
преценете дали да зададете уточняващ въпрос или да прехвърлите разговора на оператор;
да бъдат автоматично преквалифицирани от учен по данни (това не изисква група инженери, които редовно коригират сценариите за отговор).

Ако се отдалечим от примера за чат и обобщим, тогава MLOps ускорява времето за обучение и въвеждане на модел в производство. Работата е разделена между членовете на екипа по проекта и учените по данни не е необходимо сами да внедряват ML тръбопровод.

Когато приложение, базирано на AI, работи без сривове или грешки, клиентите се радват на услугите. По този начин те са доволни да продължат да си сътрудничат с марка.

MLOps гарантира по-точни прогнози. Специалистите редовно следят състоянието на модела. Когато моделът дрифтува, той се изпраща за преквалификация. Така бизнесът получава по-точна информация, въз основа на която взема важни решения без рискове.

Когато даден проект се нуждае от MLOps процес

NewVantage Partners „установиха“, че само 15% от водещите корпорации са приели технология за машинно обучение и AI в масово производство. Останалите смятат, че AI е скъп експеримент с минимална отплата. MLOps елиминира този мит. Това улеснява компаниите за разработка на машинно обучение да внедряват, проследяват и актуализират модели в производството.

MLOps е необходим за проекти, ако възникнат следните проблеми при създаването на решения за машинно обучение и AI:

моделите се изпращат в производство бавно и трудно;
модел работи отдавна, но не е актуализиран или наблюдаван;
за една организация е скъпо редовно да преквалифицира своя модел.

Често срещани погрешни схващания за MLOps

MLOps е нов подход, така че много организации нямат ясно разбиране за този процес. Невежеството поражда погрешни схващания, с които компаниите за разработка на машинно обучение се борят.

Мит 1. MLOps е само използване на конвейер.

MLOps е по-широко понятие от внедряването. За да се направи конвейерна функция, трябва да се свърши много работа: интегриране на езикови рамки с SDK рамки, управление на контейнери, контролиране на версиите на модела и свързване на многонишкови процесори и графични процесори. Освен това трябва да управлявате API, да контролирате натоварването, да отговаряте за сигурността и много повече.

Необходим е цял екип, за да се свърши този вид работа. Така че предприятията често възлагат MLO на компании за разработка на ML. По този начин те „харчат“ средно 20% по-малко пари за инфраструктура и 30% по-малко време за внедряване на модела.

Мит 2. ML включва същите процеси като стандартната разработка на софтуер.

Стандартният софтуер и ML моделът са изградени по различен начин и имат различни цели.

Машинното обучение се основава на данни. Модулният код е изграден върху услуги за данни и контейнеризирани микроуслуги. За да работи машинното обучение, имате нужда от голям брой версии, внимателно наблюдение и чести внедрявания.

Машинното обучение непрекъснато се подобрява. Инженерите на MLOps използват нови езици или библиотеки, които решават конкретни проблеми. Следователно кодовата база на ML може да включва напълно различни езици за програмиране.

Мит 3. Бизнесът поема много рискове, когато инвестира в MLOps.

Рискуват само тези, които организират MLO неправилно. Ако работите с екип, който знае как ефективно да изгради процес, инвестицията ви ще се изплати.

Заключение

Машинното обучение и изкуственият интелект са авангардни технологии. Според Statista 83% от компаниите, които включват AI и ML в своите процеси, са „увеличили“ бюджета си в рамките на три години. Бизнесът „отбелязва“, че AI автоматизира критични бизнес процеси, подобрява взаимоотношенията с клиентите и помага в борбата с хакерите.

MLOps е важен за проекти, които създават ML решения за бизнеса. Разработването на решения за машинно обучение е различно от изграждането на класически софтуер. Това изисква процеси, специалисти и ресурси. Не всяка организация ги има. Компаниите за аутсорсинг на машинно обучение предлагат най-добрите услуги DevOps, DevsecOps, DataOps и MLOps.