Ден за експерименти в WBAA

Експериментът с цифровите канали на СБ

Ние в ING WBAA знаем, че експериментирането е в основата на науката за данни и инженерството на данни. За да създадете иновативни решения за машинно обучение и креативни случаи на употреба, трябва да отделите време за изследване и експериментиране. Всеки месец организираме експериментален ден, където всеки от екипа може да препоръча експериментални теми, които са избрани чрез екипно гласуване за изпълнение в деня.

Тъй като изследването е свързано и със сътрудничество и синергии между групи от хора, които могат да донесат ценни и разнообразни прозрения, ние планирахме експеримент с екипа на WB Digital Channels на ING, насочен към групиране на потребителски профили въз основа на поведението им при кликване. Експериментът се основаваше на проекта за Customer Experience, който те разработиха и екипът им беше представен от Alexandros Batzios — инженер по функции на WB Digital Channels. Александрос работи заедно с трима членове на WBAA — Фабиан Янсен и Лорейн Д’Алмейда — специалисти по данни и Уендъл Кулинг — главен собственик на продукта.

Александрос и Лорейн предоставиха интервю, за да ни напътстват през експеримента, използваните от тях данни, резултатите и потенциала на експеримента.

Каква беше вашата мотивация да участвате в този експеримент?

Притежавайки докторска степен по технологии за семантични данни, както и като помогна за пускането на пазара на фокусиран върху данни Fintech в Лондон, Александрос имаше личен интерес да научи повече за машинното обучение чрез този експеримент:

„Идвайки от среда, ориентирана към данни, съм склонен да мисля, че повечето отговори могат да бъдат намерени в данните, така че бях много любопитен да видя какво ще разкрие прилагането на машинно обучение за кликване върху данни от InsideBusiness Portal“

Лорейн, като опитен специалист по данни със силен бизнес нюх, беше мотивирана да участва в този експеримент не само защото видя потенциал в приложимостта на констатациите, но и защото можеше да работи заедно с действителните потребители, за които е предназначен моделът.

„Намерих този случай на употреба доста интересен за работа, защото въпреки че извършихме сегментиране, специфично за потребителите в онлайн каналите, същата технология може да се използва за различни типове клиентско сегментиране. Това също даде възможност за тясна работа с ключовите заинтересовани страни. Ние си сътрудничихме и направихме нещо подобно на програмиране по двойки, за да направим първоначалния анализ и инженеринг на характеристиките. Разделихме работата, за да стартираме различните алгоритми за клъстериране с множество настройки паралелно.“

Експериментът

Този експеримент беше част от проекта Customer Experience in Digital Channels, ръководен от Андрей Илченко — Tribe IT ръководител, който започна инициативата — и Martijn van den Ordel (Chapter Lead CJE) , с Александрос като инженер по функциите.

Състои се от маркиране на страници и събития при кликване в портала InsideBusiness чрез платформата Webtrekk Analytics. След това тези събития се импортират в Datalake на ING (WB GDIL) и чрез MIBI (Информация за управление/бизнес разузнаване) могат да се видят потребителско поведение и други показатели. В една от фазите на този проект екипът искаше да приложи машинно обучение върху тези данни, за да групира потребителски профили въз основа на тяхното действително поведение. Целта беше да се създаде потребителски интерфейс с възможност за персонализиране, като например интелигентно табло за управление, но също така и да се получи представа за всички неочевидни модели на използване, които се развиват с течение на времето.

„Голяма част от експеримента беше усилието за инженеринг на данни, което се състоеше от трансформиране на данните във форма, която може да се използва като вход за алгоритми за машинно обучение. Трябваше да проследим и да свържем събития с щракване с отделни (анонимизирани) потребители и компаниите, които представляват. Освен това трябваше да се справим с проблеми с качеството на данните, като идентифицирахме и премахвахме невалидни тагове.

Накрая, след като данните бяха готови за обработка, трябваше да проведем множество експерименти, за да определим нивото на детайлност, което би имало смисъл, както и характеристиките (функциите), които искахме да включим в анализа. Машинното обучение е наука, смесена с малко изкуство, тъй като характеристиките, които избираме от набор от данни, за да се използва като вход, значително влияят на резултата от даден алгоритъм. Няма начин да се знае кои са „правилните“ променливи, които да се използват за анализ, така че това изисква малко интуиция, както и проба и грешка.

В този момент трябва да кажа колко важен беше приносът на екипа на WBAA. За 2 дни програмиране по двойки успяхме да изберем правилните характеристики на данните за анализ, да оптимизираме времето за изпълнение и използването на паметта, така че всъщност да можем да провеждаме множество експерименти на ден (в сравнение например с това, че трябва да чакаме с часове за експеримент) и свържете данните по такъв начин, че да получите значими резултати“ — Александрос

Данните и техниките

За този експеримент бяха използвани аналитични данни на Webtrekk, обогатени с персонализирано маркиране за конкретни кликвания и страници на InsideBusiness Portal. За да се опрости процеса, извадката се състоеше от анонимни данни за един месец от производствената среда.

„Обединихме тези данни с потребителски данни от InsideBusiness Portal, за да можем да идентифицираме отделни потребителски роли и компанията, към която принадлежи всеки потребител. Това ни позволи да включим клиентите (компании, които плащат абонамент за определен брой потребители) в анализа, без да е необходимо да пренасяме лична информация за клиенти извън InsideBusiness” — Александрос

„Направихме първоначален анализ и ETL, за да свържем регистрационните данни с информацията за клиентите, предварителна обработка на данните, за да излезем със значими функции и използвахме някои неконтролирани алгоритми за обучение като KNN и йерархично клъстериране за сегментирането“ — Лорейн

Резултатите

Резултатите от експеримента бяха доста обещаващи, тъй като екипът успя да идентифицира конкретни модели в потребителското поведение или корпоративната функция. Тези прозрения могат да се използват за по-нататъшно сегментиране и оттам персонализирани табла за управление според предпочитанията на потребителите. Това сегментиране може да улесни процесите на вземане на решения и да подобри опита на потребителите.

„Успяхме да идентифицираме клъстери както от отделни потребители, така и от корпорации въз основа на често повтарящи се модели на използване“

Имаше например клъстери от потребители, които изглежда имаха множество роли като администратори и изпълняващи плащания. Или потребители в компании и функции, които изглежда често посещават центъра за знания и след това създават билети за заявка за услуга. Това може да е полезно, за да проучим дали това са едни и същи потребители във времето, дали всички имат една и съща корпоративна функция или работят за определена индустрия и какво им е трудно да направят. Открихме също клъстери от компании чиито потребители комбинираха определени продукти и канали и специфична функционалност на тях.

Това бяха само резултати от високо ниво, някои от тях вероятно си струва да се разгледат. Но основната полза ще дойде от възможността да изпълнявате това последователно и да виждате как моделите на използване се променят през месеците, както и да провеждате тези експерименти на по-детайлно ниво, като например за продукт/приложение, а не за канал. Тогава всеки CJE би могъл да види от първа ръка точно какви са обичайните поведения, модели и може би дори пречки на техните потребители.

Едно е сигурно. Независимо дали това се използва за разкриване на нови тенденции или за валидиране на бъдещи работни предположения и стратегии, ерата на спекулациите бързо отстъпва място на ерата на вземане на решения, базирани на данни! Много благодаря на WBAA за помощта на WB Digital Channels в тази насока” — Александрос

„Някои от клъстерите от алгоритъма бяха в съответствие с интуицията, базирана на специфични за потребителя роли. В рамките на цифровите канали на WB те имат сегментация, която предоставя на потребителите конкретен изглед/табло за управление въз основа на техните функции/роли. Сегментирането, базирано на поведението на потребителите, ще помогне на клиентите да бъдат сегментирани въз основа на действителното им поведение, а таблото за управление може да бъде персонализирано според действителната им употреба“ — Лорейн

Експериментирането също е от съществено значение, когато работите гъвкаво. Можем да развиваме уменията си, да споделяме знания, да бъдем креативни, да тестваме и оценяваме различни решения и модели за машинно обучение и оттам да уловим идея, която може да бъде полезна за бъдещ модел. В този процес синергията между Александрос, който внесе своя опит в инженерството, технологиите за данни и цифровите канали, и нашия опит в машинното обучение, разкри интересно решение, което може да бъде допълнително проучено и да доведе до ценно решение за организация.

Ако се интересувате да научите повече или имате творческа идея и бихте искали да се присъедините към един от нашите експериментални дни, моля, изпратете имейл на [email protected]