Ефективни презентации за научни данни

Ако сте нов в областта на Data Science, исках да предложа някои съвети как да преминете от презентации, които сте изнесли в академичните среди, към създаване на ефективни презентации за индустрията.

За съжаление, ако вашият опит е в областта на математиката, статистиката или компютърните науки, вероятно никой не ви е подготвил за създаване на страхотна презентация в индустрията. И истината е, че изисква практика. В академичните среди споделяме таблици с t-статистики и p-стойности и говорим много за математически формули. Това всъщност е обратното на това, което бихте искали да направите, когато представяте пред нетехническа аудитория.

Ако аудиторията ви е пълна с куп докторанти в областта на STEM, опитайте се, но в много случаи трябва да коригираме начина, по който мислим за представянето на нашия технически материал.

Мога да продължа безкрайно тази тема, но тук ще разгледаме:

Говорейки за продукцията на модела, без да говорим за модела
Рисуване на картината с помощта на действителни клиенти или входове
Отделете време за разказване на историята

Говорейки за продукцията на модела, без да говорим за модела

Някои модели наистина се поддават добре на това. Логистична регресия, дървета на решенията, те просто крещят да бъдат оживени.

Не искате да копирате/поставяте изходен модел във вашите презентации. Освен това не искате да форматирате изхода в хубава таблица и да го поставите във вашата презентация. Искате да разкажете историята и коефициентите на лог със сигурност няма да разкажат историята за вашите заинтересовани страни.

Една добра първа стъпка за модел на логистична регресия би била просто да потенцирате логаритмичните коефициенти, така че да работите поне по отношение на коефициентите. Тъй като този изход е мултипликативен, можете да кажете:

„За всяко увеличение на единица от [променлива] очакваме да видим увеличение от x% средно, като всичко останало се поддържа постоянно.“

Така че вместо да говорим за техническите аспекти на модела, ние просто говорим за това как различните драйвери влияят на изхода. Можем обаче да направим тази крачка напред.

Използване на действителни клиенти за рисуване на картината

Обичам да използвам случаи на употреба в реалния живот, за да демонстрирам как работи моделът. По-горе виждаме нещо подобно на това, което представих, когато говорих за моя модел на сезонност. Разбира се, промених името му за тази публикация, но в презентацията щях да говоря за бизнеса на този човек, защо е сезонен, да покажа очевидния сезонен модел и да им кажа, че моделът класифицира този човек като сезонен. Не говоря за трансформации на Фурие, описвам как се категоризират истинските хора и как бихме искали да мислим за маркетинг към тях. Задълбочаването по този начин също ми помага да разбера по-добре голямата картина на случващото се. Всички знаем, че когато копаем по-дълбоко, виждаме някои луди поведенчески модели.

Извличането на конкретни клиенти/случаи на употреба работи и за други видове модели. Изградихте ли модел на задържане? Изберете двойка души с голяма вероятност да се разпаднат и двойка с малка вероятност да се разпаднат и говорете за тези хора.

„Мери тук е клиент от дълго време, но напоследък е по-малко ангажирана и не е правила x, y или z (моделни шофьори), така че вероятността тя да анулира абонамента си е висока, въпреки че клиентите с по-дълъг стаж обикновено са по-малко склонни да напуснат.“

Отделяне на времето за разказване на историята

Както беше посочено по-горе, е необходима допълнителна работа, за да се сглобят тези неща. Друг чудесен пример е клъстерният анализ. Бихте могли да създадете слайд за всеки атрибут, но тогава хората ще трябва да прегледат множество слайдове, за да разберат КОЙ наистина е клъстер 1 срещу клъстер 2 и т.н. Искате да обедините цялата тази информация за вашия потребител. И не се въздържам да измислям скъпи имена за моите сегменти, просто идва с територията :).

Тук си струва да се отбележи, че ако не обобщих цялата тази информация по клъстери, също нямаше да мога да говоря на високо ниво за това кой всъщност влизаше в тези различни клъстери. Това би било голям пропуск от мое име, защото в края на деня вашите заинтересовани страни искат да разберат голямата картина на тези клъстери.

Всеки анализ, който представям, прекарвам време в мислене какъв трябва да бъде подходящият поток за историята, която данните могат да разкажат. Може да имам нужда от допълнителна информация като навлизане на пазара по география (или нещо подобно, възможностите са безкрайни). Броят на малките предприятия по география може да не е нещо, което имах в моя модел, но с малко търсене в Google мога да го намеря. Вложете малко допълнителна работа, за да направите изчислението за навлизане на пазара и след това създайте карта и използвайте тази информация, за да подкрепите допълнително моята история. Или може би научавам, че проникването на пазара не подкрепя моята история и трябва да направя повече анализи, за да стигна до истинската същност на случващото се. Ние сме детективи. И ние не се занимаваме само с данните, които всъщност са в модела. Опитваме се да изследваме всичко, което може да даде интересна представа и да помогне да се разкаже историята. Освен това, ако вършите допълнителната работа и откриете, че историята ви е невалидна, току-що сте си спестили мъка. Много по-лошо е, когато първо представите, а по-късно разберете, че заключенията ви са грешни. уоуп уоуп.

Затваряне на коментари

Преди да започнете да създавате модел, вие сте се уверили, че резултатът ще бъде приложим, нали? В края на вашата презентация със сигурност искате да говорите за следващите стъпки за това как вашият модел може да бъде използван и да добавите стойност, независимо дали това идва с идеи за това как можете да общувате с клиентите по нов начин, на който смятате, че те ще отговорят, намалете задържането, увеличете придобиването и т.н. Но го изяснете. Отделете време, за да измислите конкретни примери за това как някой може да използва този резултат.

Бих искал също да спомена, че научаването на най-добрите практики за създаване на страхотни визуализации ще ви помогне изключително много. Има две статии от Kate Strachnyi, които обхващат части от тази тема. Можете да намерите тези статии тук и тук.

Ако създадете слайд и имате проблеми с намирането на това, което „И какво от това?“ е от слайда, вероятно принадлежи към приложението. Когато създавате първите няколко тестета в кариерата си, може да ви смаже да не включите слайд, на който сте прекарали много време, но ако не добави нещо интересно, за съжаление този слайд принадлежи към приложението.

Надявам се, че сте намерили поне един съвет в тази статия, който ще можете да приложите в следващата си презентация. Ако мога да помогна само на един човек да създаде страхотна презентация, ще си заслужава.

Първоначално публикувано в datamovesme.com на 10 септември 2018 г.

Ефективни презентации за научни данни

Ефективни презентации за научни данни

Подобни въпроси