Аномалиите са широко разпространени, когато става въпрос за работа с данни. Те стават жизненоважни във времеви редове. Затова е изключително важно да се предложат ефективни методи за тяхното откриване и справяне с тях. Тази статия илюстрира модерен модел, наречен DGHL за откриване на аномалия. DGHL включва ConvNet като генератор и вместо да кодира, увеличава максимално вероятността с алгоритмите за редуващо се обратно разпространение.

Както може би знаете, времевите редове са навсякъде, във всяка индустрия, за която мислите. Всички сме чували за извънредни стойности като точки от данни, които са далеч от своите съседи или други точки (глобални и локални извънредни стойности) и е вероятно да намалят точността и надеждността на нашия модел (или понякога полезни🤞); Тези аномалии са неизбежни за избягване в реалния свят (сензори, …).

Тези аномалии могат да се видят както в едновариантни, така и в многовариантни набори от данни за времеви редове, както можете да видите на Фигура 1 (и за двата типа: точково отклонение, последващо отклонение)

Сега знаем какво представлява Аномалията! Страхотна работа!😉 Нека да разгледаме общоприетите техники за откриване на аномалии: STL декомпозиция, CART (Дървета за класификация и регресия), базирани на клъстери, базирани на разстояние, автоенкодери и т.н. (за повече информация можете да намерите прегледа доклади от 1, 2, 3). Многобройни методи обаче се занимават с поточни времеви серии; само малцина могат постепенно да се настроят към еволюцията на времевия ред.

Тази статия представлява нов модел (DGHL); с други думи, Дълбок генеративен модел, базиран на конволюционна мрежа отгоре надолу(ConvNet), който показва многовариантни прозорци с данни към изискан йерархично латентно пространство. DGHL работи, като прави наблюдаваната вероятностмаксималнадиректнос алгоритъма за редуващо се обратно разпространениеи кратко- стартирайте MCMC; следователно не може да се разчитана спомагателни мрежикато енкодери или дискриминатори.

Моля, обърнете внимание, че не споменах илюстрацията на математически уравнения, за да не стане статията твърде дълга

Дълбок генеративен модел с йерархични латентни фактори (DGHL)

1. Йерархични латентни фактори

Тук можем да открием, че конкатенационен слойи конволюционна мрежа отгоре надолу(ConvNet) се получават съответно за модела на състояниетои генераторния модел(вижте фигурата 3).

На фигура 3. можем да видим йерархичното латентно пространство с a= [1,3,6]. Основният елемент в това пространство е използване на динамикатачрез позволяванесъздаване на реалистични времеви редовес произволна дължинакато същевременно се запази тяхната дългосрочна динамика. Йерархичната структураможе да бъде включена като хиперпараметриза да бъде настроенаили предварително обучени.

Ние управляваме модела гъвкавосттачрез относителния размер на вектора на състоянието от най-ниско ниво и горните нива.

2. Обучение с редуващо се обратно разпространение

Използваме алгоритъма за редуващо се обратно разпространениеза инструктиранена параметрите Θна DGHL, чрез директно повишаване на наблюдаваната логаритмична вероятност:

Алгоритъм 1 показва алгоритъма за редуващо се обратно разпространение смини-партиди. Тук имаме двеотличителни стъпки,включително 1. изводно обратно разпространение 2. обучаване на обратно разпространение. Можете да видите неговата процедура на следващата фигура 4.

Единственият недостатък на MCMC методитее разходите за изчисление. Между другото, Langevin Dynamicsзависи и разчита на градиентите на функцията Generator,които могат да бъдат приложени лесно от PyTorch или TensorFlow.

3. Онлайн откриване на аномалии

Моделът DGHL научи как да произвежда прозорци на времеви серии въз основа на нашия набор от данни за обучение (Y); Той позволява на модела да изучава нормални(неаномални) последователни данни и отношения сред различни времеви редове. Тук ще опиша метода, използван за възстановяване на windows върху незабелязани тестовиданни Yᵗᵉˢᵗ в процесана откриване на аномалия.

Тестовият набор Yᵗᵉˢᵗ се използва като поток от времеви серии m в Онлайн откриване на аномалии. Подобно на набора от данни за обучение, ние разделяме Yᵗᵉˢᵗ в последователни прозорцисъс същите параметри Sw и S. Тук оценките за аномалии в един прозорец се изчисляват всеки път.

Има нова стратегиякоято прави DGHLизключителен; минимизиранетона условната грешка при повторно изгражданена научените модели Fи G е резултатот максимизиране наа постериориен режимтова е съответствието от предполагаемите фактори.

4. Онлайн откриване на аномалия с липсващи данни

От Фигура 4. (ABP алгоритъм), можем да видим, че първата стъпкае извеждане на латентни вектори с Динамика на Langevin. Алгоритъмът може да обработва липсващи данничрез извличане на Z чрез изчисляване на остатъцитеточно на наблюдаваният сигнал Yₒᵦₛ. Изведените вектори потвърждават проби от задното условно разпределениена сигнала.

Изненадващо е, че генеративните модели (обучени на базата на ABP алгоритъм) показаха по-добри резултати от VAE и GAN, когато данните имаха липсващи стойности както за CV, така и за NLP задачи.

Можем да видим пример за закрити данни на Фигура 5. Закритите сегменти са маркирани в сиво. Лесно можем да видим, че DGHL възстанови данните със значителна точност, въпреки че в тези периоди повечето от данните бяха пропуснати. Това е важно за задачата за откриване на аномалии, тъй като данните се самоизползват за изчисляване на резултата за аномалии.

Освен това можем да видим, че алгоритъмът може да възстановявалипсващите точки от данни,което е невероятно при перфектни тръбопроводис приложения надолу по веригата.

Набори от данни

В този проект са използвани 4 набора от данни:

  1. Набор от данни за сървърна машина (SMD): многовариантен набор от данни с 38 функции за 28 сървърни машини, въведен в PAPER.

2$3.Активен пасивен сателит за влага на почвата (SMAP) и марсоход на Марсианската научна лаборатория (MSL): SMAp включва 55 многовариантни набора от времеви серии, като всеки включва 24 променливи. MSL съдържа 27 набора от данни, като всеки съдържа 54 променливи.

4.Сигурно пречистване на водата (SWaT): публичен набор от данни за тестова среда за пречистване на вода. Наборът от данни е достъпен тук.

точност

Можем да видим, че моделът DGHL е сравнен с редица други методи на Фигура 6, която показва изключителен F1 резултат.

Основна справка

  1. Challu, C., et al., Deep Generative model with Hierarchical Latent Factors for Time Series Anomaly Detection. arXiv preprint arXiv:2202.07586, 2022.

Надяваме се, че тази статия ви е харесала. Моля, не се колебайте да се свържете с мен директно чрез Twitter или LinkedIn по каквато и да е причина. Ако намерите някакви грешки, моля, просто ме уведомете. Тази статия е написана за бъдещите ми проекти.