Португалската версия е достъпна тук

Въведение

В средата на електронната търговия е от решаващо значение да се идентифицира възможно ненормално поведение на клиента, тъй като това може да означава злонамерена атака. Тези поведения могат да включват прекомерно пазаруване, опит за влизане с неправилни пароли или дори опит за финансова измама. Ако не бъдат решени, тези аномални поведения могат да причинят значителни щети на компанията, включително финансови загуби и увреждане на репутацията на марката.

Решение за идентифициране и лечение на тези аномални поведения е използването на алгоритъма на изолационното дърво. Този алгоритъм се основава на създаването на дървета на решения, които разделят набора от данни на по-малки подмножества, като по този начин идентифицират възможни извънредни стойности, тоест данни, които се отклоняват от нормалния модел на поведение. Този алгоритъм е особено полезен за идентифициране на потенциални измами с кредитни карти или потребителски акаунти.

Код - практически

Пример за код, използващ алгоритъма на дървото на изолацията, може да бъде както следва:

from sklearn.ensemble import IsolationForest

hist_observations = [[700.1], [450], [100], [200], [140], [250], [200], [320]]
new_observations = [[0.1], [0], [90],[195], [800],[122]]

clf = (
    IsolationForest(random_state=10, 
                    contamination = 'auto')
                    .fit(hist_observations)
)

clf.predict(new_observations)py

Този код създава модел на изолационно дърво в Python. Въвеждаме набор от данни за исторически наблюдения (hist_observations) и набор от нови наблюдения (new_observations), адаптираме модела към историческите данни и прогнозираме аномалии в новите наблюдения. Моделът на изолационното дърво връща -1 за данни, които се считат за аномални, и 1 за нормални данни.

Обърнете внимание, че за да се предотвратят атаки в реално време, новите наблюдения могат да се получават и в реално време!

Изпълнявайки кода, ще имаме резултата по-долу, показващ, че всички нови записи са аномални, т.е. много различни от наблюдаваното в миналото, с изключение на стойността 195 .

# Input [[0.1], [0], [90],[195], [800],[122]]

# Output of clf.predict(new_observations)
array([-1, -1, -1,  1, -1, -1])

Заключителни мисли

Моделът на изолираното дърво е много полезен инструмент за идентифициране на първите и основни аномални поведения в онлайн бизнес среди, но си струва да запомните, че трябва да се използва заедно с други решения за сигурност, тъй като алгоритъмът може да не открие 100% от всички типове на измами и злонамерени дейности.

В заключение, идентифицирането и справянето с необичайно поведение е от съществено значение в среда на електронна търговия, за да се избегнат финансови щети и увреждане на репутацията на компанията. Използването на алгоритъма за изолационно дърво е жизнеспособно решение на този проблем, което позволява на компаниите да идентифицират потенциални измами и да защитят бизнеса си от злонамерено поведение.

Създавайте връзки

Хареса ли ви съдържанието? Хайде да пием кафе, добавете ме в LinkedIn, за да обменяме идеи и да споделяме знания!

https://www.linkedin.com/in/iagombrandao

Препратки

Liu, F., Xie, X., & Zhou, L. (2019). Откриване на аномалии за платформа за електронна търговия, базирана на подобрен алгоритъм за изолираща гора

Chen, X., Luo, C., & Wang, H. (2021). Откриване на аномалии за потребителско поведение в електронната търговия, базирано на подобрен алгоритъм на Isolation Forest