Машинното обучение (ML) се превърна в предпочитания щит за компаниите, които искат да защитят бизнеса си срещу заплахи за сигурността. Със способността за незабавно откриване на рискови фактори, реагиране на пробиви в реално време и дори предвиждане на бъдещи инциденти — ML добавя мощен слой от 24/7 защита, който значително подобрява усилията на екипа по сигурността.

Това е целта на едно предприятие от Fortune 100, когато разработи десетки модели за сигурност. Освен че сегашната им настройка на ML направи „производството на тези модели ненужно бавно, трудно и скъпо“. Стана още по-трудно след честото преобучение и повторно внедряване на модели, което ги направи по-сложни (напр. включващи задълбочено обучение или обработка на естествен език) и следователно много по-трудно да влязат в производство.

Всички тези препятствия оставиха предприятието с машинно обучение, което не можаха да внедрят навреме, ресурси, чиято поддръжка беше скъпа, и невъзможност да постигнат стабилната защита, от която се нуждаеха.

Влезте в Wallaroo с неговия опростен ML тръбопровод и високоефективен механизъм за обработка на данни. Wallaroo надхвърли първоначалните критерии за успех, постигайки:

  • 553% по-бърза обработка на данни
  • 50% повече работещи модели
  • 75% намаление на изчислителните разходи

Ето цялата история.

Задният фон

Утвърдена здравноосигурителна корпорация разчиташе на комбинация от вътрешна обработка на данни, „Apache Spark“ и „Splunk“, за да открива и противодейства на аномални събития в областта на сигурността (напр. подозрителни мрежови връзки, вътрешни или външни трансфери на данни) в своите обширни операции.

Техният екип за наука за данни разработи над 50 ML модела, които след това екип за инженеринг на данни щеше да пусне в производство. Но за да използва напълно тези модели, тяхната ML система трябваше да:

  • Незабавно обработвайте милиони ежедневни комуникации и милиарди мрежови събития, за да уловите инциденти в реално време.
  • Бързо привеждане в действие на ML моделите, за да изпреварите заплахите за сигурността чрез непрекъснати иновации.
  • Позволете на специалистите по данни лесно да преквалифицират своите модели въз основа на нови данни, за да подобрят производителността.
  • Използвайте ефективно изчислителните ресурси, за да поддържате ниски разходите за инфраструктура.

Проблемът

Като се има предвид мащабът на техните нужди от машинно обучение, текущата им настройка не беше забележително недостатъчна, хвърляйки техния лош екип за наука за данни с главата напред в някои значителни предизвикателства:

Твърде много време и разходи за производство на модели: Всеки модел се нуждаеше от 2–4 седмици, за да премине от разработката до производството. Тъй като технологичният стек не го улесняваше, учените по данни трябваше да отделят значително време, за да помогнат на инженерите да приведат в действие моделите. Това нежелано разсейване ги отклони от експериментирането, иновациите и правенето на това, за което всъщност са се записали.

Преобучението и внедряването бяха трудни и забавени: С нови заплахи и фини рискови модели, които се прокрадват всеки ден, моделите трябва постоянно да се преобучават и преразпределят, като се използват най-новите данни. Учените по данни щяха да усъвършенстват своите ML модели, но тъй като всеки от тях отнемаше няколко седмици, за да започне да работи, ползите от преквалификацията бяха редки и краткотрайни. Плюс това, много от тези модели изобщо не са пуснати в производство.

Скъпа инфраструктура за поддръжка: Всеки модел изискваше независим клъстер — и те имаха над 100 модела за изпълнение. Това доведе до около 1000 сървъра, необходими за обработка на всички производствени данни, което увеличи разходите за инфраструктура до впечатляващите 3 милиона долара годишно. Освен това те все още трябваше да добавят разходите за оперативни разходи от управлението и мащабирането на всички клъстери.

Данните не се обработват в реално време: Данните се обработват на партиди в края на деня или на 15-минутни микропартиди. Това означаваше, че аномалиите няма да бъдат открити дотогава, оставяйки компанията изложена на пробиви и подбивайки ефикасността на техните ML модели.

Въведете Wallaroo

Уморени от загубата на авангардни модели заради муден ML тръбопровод, предприятието привлече Wallaroo — платформа за производствен AI и анализи, известна със своята светкавична обработка на данни, внедрявания с две кликвания и наблюдение в реално време.

Облачна среда по техен избор (в този случай: Microsoft Azure) беше създадена за специалистите по данни, за да качат своите модели и лесно да ги преобучат въз основа на показатели за ефективност, генерирани от Wallaroo. За тяхно облекчение те можеха да преобучат моделите си с помощта на инструментите, които вече познаваха (напр. Jupyter Notebook, TensorFlow) и след това незабавно да преразпределят.

Ако моделите открият някакви аномални събития, този изход се изпраща надолу по веригата към тяхната съществуваща Splunk среда. Което означава, че не е трябвало да променят цялата си ML система, за да интегрират Wallaroo — просто го включете, за да замените частите, които не работят, и го свържете към частите, които работят.

В продължение на 30 дни специалистите по данни стартираха, тестваха и повториха своите алгоритми с Wallaroo и откриха, че най-накрая могат да осигурят резултатите, които предприятието очаква от своя ML.

Ето един поглед как изглежда това:

Разликата в Wallaroo

Само след 30 дни екипът за наука за данни успя да приведе в действие 50% повече ML модели от преди, да ги внедри в рамките на секунди (а не седмици) и всичко това, като използва 75% по-малко изчислителни ресурси.

Това беше променящ играта резултат за техния бизнес, оставяйки техния (много по-щастлив) екип за наука за данни със следните предимства:

Бързо и лесно производство: Чрез премахване на сложния реинженеринг, Wallaroo превърна 2-4 седмици пускане в действие само в няколко секунди, гарантирайки, че всеки модел – дори и усъвършенстваните – винаги достига до производство.

Лесно преобучение и повторно внедряване: Свръхбързият анализ на данни и показателите в реално време позволиха на специалистите по данни да актуализират често своите модели и бързо да ги разгръщат за непрекъснато подобрено откриване на пробиви.

Обработка на данни в реално време: Като най-бързата платформа на пазара за производствен AI, Wallaroo може да обработва всяко количество данни в реално време, така че моделите да могат да откриват и реагират на аномалии в секундата, в която се появят.

По-малко инфраструктура за поддръжка: С възможността да изпълнява множество модели на един сървър, екипът може да изпълнява своя ML, използвайки много по-малко инфраструктура и с драстично по-ниски разходи за поддръжка.

„Пазарът показа, че компаниите, способни успешно да използват AI, имат огромно конкурентно предимство. Ето защо основната мисия на Wallaroo е да помогне на компаниите да успеят да разположат, оперират и итерират своя AI.“ — Арън Фридман, вицепрезидент по операциите, Wallaroo.

Wallaroo може да направи същото за вас

AI и ML стават незаменими за организациите, за да защитят своите данни и клиенти от бързо развиващите се заплахи за сигурността. Но за да си струва инвестицията, имате нужда от правилната технология във вашия ъгъл.

Точно като здравноосигурителното предприятие в този случай, повечето компании свързват няколко решения заедно и в крайна сметка карат екипа си за наука за данни да работи два пъти повече. Wallaroo е различен. Това е платформа „всичко в едно“, която преосмисля бъдещето на производствения AI, така че компании от всякакъв размер могат да имат корпоративен клас ML операция на малка част от разходите.

„Свържете се“ днес, за да започнете да внедрявате своя ML по различен начин.