Според последните проучвания глобалната цена на измамите е с 80% по-висока от БВП на Обединеното кралство. След избухването на пандемията от коронавирус онлайн измамите се увеличиха отчасти поради силното разчитане на онлайн системи (преминаване към отдалечени бизнес операции), както и свързаните с коронавирус измами.

Ефективен подход за откриване на измамна дейност е чрез използването на автоматизирани системи за машинно обучение. Тези системи могат да бъдат скъпи и следователно са достъпни предимно само за по-големи организации. Друг подход може да бъде изграждането на такава система вътрешно, въпреки че по-малките стартиращи компании може да нямат ресурсите и експертния опит за изграждане на такава система.

FraudML са разработили решение, което е достатъчно мощно, за да отговори на нуждите на по-големи организации, но което също може да бъде намалено, за да отговори на ограничените изисквания на по-малка операция.

Използвайки подход за дълбоко обучение, а именно автоматични енкодери, ние сме в състояние ефективно да правим разлика между измама и не-измама. Нашето решение е под формата на алгоритъм, достъпен на AWS Marketplace. Ако средният потребител желае да тества продукта, за да докаже неговата ефективност, той може лесно да бъде стартиран в Amazon SageMaker. Ако по-голяма организация желае да разшири използването си, тогава алгоритъмът може просто да се използва във връзка с по-голям екземпляр. Цялата тази информация е достъпна на страницата на AWS Marketplace по-долу.



Подробностите около използването на алгоритъма са публикувани на нашата страница в GitHub. Наборът от данни, използван в примера, е наборът от данни за откриване на измами с кредитни карти, наличен в Kaggle. Данните са силно дисбалансирани, като потвърдените случаи на измами представляват около 0,001% от общите записи. Както е в случая с много случаи на измама, класовият дисбаланс може да се счита за твърде сериозен, за да се използват традиционни подходи за класифициране, дори с повторно вземане на проби чрез SMOTE и т.н. Нашето решение е по същество алгоритъм за откриване на аномалия, т.е. такъв, който научава как изглежда „добро“, и от това може да заключи какво „не е добро“, което следователно се счита за аномално.

Потребителят на алгоритъма не трябва да извършва конкретно вземане на проби, тъй като това се обработва изрично от самия алгоритъм. Всичко, което се изисква, е данните за обучение да бъдат етикетирани, 1 за измама и 0 за не-измама, и че този етикет е първата колона от набора за обучение (обща практика на Amazon SageMaker).

Допълнителна полза от това решение е, че алгоритъмът връща вероятностен резултат, а именно такъв, който се отнася до вероятността потребителят или транзакцията да са измамни. Това се оказа изключително полезно на практика и е интуитивна част от алгоритъма, която бизнес потребителите разбират.

За да стартирате този алгоритъм на Amazon SageMaker, първо трябва да клонирате/изтеглите репото от нашия GitHub акаунт и да го заредите в екземпляр на бележник на SageMaker. След това ще трябва да се абонирате за алгоритъма чрез AWS Marketplace. Накрая ще ви бъде издаден уникален ARN, който бихте заменили в скрипта по-долу.

Ефективността на подхода на автокодера е много по-добра в сравнение с традиционните техники за откриване на аномалии, като изолационни гори, еднокласови опорни векторни машини и локален коефициент на отклонение. Радваме се, че пуснахме продукт, който предоставя мощен алгоритъм за дълбоко обучение в ръцете на всеки с достъп до AWS.



Надяваме се, че сте намерили тази статия за полезна. Ако искате да чуете повече, моля, не се колебайте да се свържете с нас.

Препратки

Финансовата цена на измамата 2019, Кроу, http://www.crowe.ie/wp-content/uploads/2019/08/The-Financial-Cost-of-Fraud-2019.pdf