Решение за наука за данни за политики за поверителност, които всъщност никой не чете

Защо поверителност?

„Ако нямате какво да криете, не трябва да се притеснявате.“ Този често чуван аргумент е грешен опит да се оправдае и рационализира компрометирането на нечия неприкосновеност на личния живот. Освен това мисля, че логиката на страничния наблюдател като тази позволява на силните постепенно да посегнат на правата ви, докато не стане твърде късно.

В последния семестър на „магистърската програма по наука за данни (MIDS)“ на Училището по информация на Калифорнийския университет в Бъркли студентите имат за задача да изградят минимално жизнеспособен продукт (MVP). Навлизайки в тази последна фаза на висшето училище, се почувствах оптимистично настроен относно възможността да използвам уменията за наука за данни, които развих през изминалата година, за да подобря разбирането си за достойна кауза. Причината, която моят екип („Дженифър Патерсън“, „Джулиан Пелзнер“ и „Оли Даунс“) и аз избрахме да преследваме, беше поверителността в интернет.

Нахлуването ми в поверителността беше подхранвано от едновременната ми работа в „Института за сигурност и технологии“. Докато провеждах предварително проучване за това как дигиталните платформи влияят върху човешкото познание и как това от своя страна влияе върху демократичните институции, открих, че постоянно се чудя защо хората се доверяват толкова много на онлайн платформите. Обратно, защо трябва да бъдем скептични към онлайн форумите? (Отказ от отговорност: всяко споменаване на продукти/плъгини, проектирани от мен, не е свързано с Института за сигурност и технологии или с някой от техните проекти или програми по какъвто и да е начин.) Въпреки че не мога да отговоря напълно на тези въпроси, моето участие с моя основен проект ми даде възможност да се справя с тези проблеми.

В разгара на глобалната пандемия от COVID-19 прекарваме повече време онлайн от всякога. Съответно събирането на данни и мониторингът също се увеличават. Дебатите относно компромисите от проследяването на контактите и наблюдението се разгръщат пред очите ни. От една страна, проследяването на контактите може да помогне за ограничаване на разпространението на вируса. От друга страна, как правителствата ще използват същата технология за наблюдение, след като преодолеем пандемията? Наистина ли вярваме, че правителствата ще се откажат от привилегията си да използват тези усъвършенствани инструменти? Кой може да каже, че институциите на властта няма да се обърнат и да използват подобна технология, за да експулсират имигранти или да идентифицират и тормозят граждани, изразяващи своите права на протест от първата поправка?

Моят учител по история в 11-ти клас, Анди Оуенс, казваше: „Привилегията никога не се отказва доброволно“. Мисля, че това продължава да звучи вярно в тези несигурни времена. Дискусията за онлайн поверителността не може да бъде по-уместна. Това не е нов проблем. За по-задълбочено обсъждане на избягването на риск за неприкосновеността на личния живот и поведението, свързано с поверителността, прочетете С нас е безопасно! Науката за поверителността на потребителите от Алиса Фрик и Матилда Рук. Ето няколко интригуващи открития, споменати в тази статия:

  1. „Шест от десет“ възрастни американци смятат, че е невъзможно да преминат през ежедневието си, без да бъдат събрани данните им, като 81% смятат, че потенциалните рискове надвишават ползите.
  2. 69% от хората в световен мащаб казват, че биха избегнали да правят бизнес с марка, ако нейното използване на данни е твърде инвазивно.
  3. 78% от хората в Обединеното кралство, САЩ, Франция и Германия казват, че пазят финансовата си информация, в сравнение със само 57%, които казват същото за информацията си за контакт.
  4. Само 9% от американците винаги четат политика за поверителност, преди да подпишат Правилата и условията (T&C), а 47% от хората са изразили умора от уведомяване от съобщения относно Общия регламент за поверителност на данните на Европейския съюз.
  5. 72% от американците смятат, че почти всичко или повечето от това, което правят онлайн или на телефона си, се следи от рекламодатели и технологични фирми.
  6. 48% от потребителите, които се грижат за поверителността, са се прехвърлили към компании или доставчици на услуги поради техните политики и практики за данни.
  7. „14% от британците“ биха били готови да споделят данни, ако им се плати за това. Но тези изплащания могат да бъдат и косвени. Изследване от Университета на Йорк предполага, че 54% от британците са готови да пожертват част от поверителността на данните си, за да съкратят продължителността на блокирането. Освен това, 73% от хората биха били отворени за споделяне на данни, ако една компания беше по-прозрачна за това как ги използва.

Подкрепихме тази статистика с нашето собствено потребителско проучване, което разкри, че 50% от респондентите съобщават, че никога не са чели политиката за поверителност на даден уебсайт и никой от нашите респонденти не е казал, че винаги чете политика. Освен това, на въпроса дали се чувстват отговорни в интернет, 67,2% от респондентите казаха „не“ или „не знам“. Това не само ни показва, че интернет потребителите не смятат, че техните нужди за безопасност са удовлетворени, но също така ни показва, че много потребители просто не знаят дали информацията им е безопасна или не.

Проблемът, с който се стремим да се справим, е свързан с политиките за поверителност, които в идеалния случай трябва да бъдат мястото, където потребителите да се чувстват спокойни относно безопасните практики за събиране на данни на дадена компания. Това обаче рядко е така. Основният проблем с политиките за поверителност е, че те са твърде дълги и пълни с технически жаргон и „легални“. Политиките за поверителност често се пишат от адвокати, които се стремят да изолират компаниите от съдебни спорове. Те рядко се пишат, за да защитят интересите на потребителите и да популяризират тяхната осведоменост. Наскоро стана все по-модерно от гледна точка на връзките с обществеността да се изграждат по-прозрачни политики за поверителност. Въпреки това, това са странични случаи и политиките за поверителност остават трудни за четене, разбиране, обобщаване и анализиране на средния интернет потребител. Истината е, че повечето хора не ги четат и без да искат се съгласяват.

Термит

Ето защо пускаме Termite: безплатен инструмент за добавка за браузър, който използва уеб скрапинг и NLP подходи за автоматизиране и мащабиране на оценката и оценката на онлайн условията за обслужване, условията и договорите, и политики за поверителност. Termite също така предоставя на потребителите персонализирани отчети за киберхигиена и дава възможност на потребителите да проследяват своите онлайн споразумения, всичко това в реално време. Ние се стремим да оптимизираме потребителския интерфейс, информираността и възможността за действие. Когато политиките за поверителност и правилата и условията са нечетливи, Termite ги оценява и проследява. Когато потребителите се чувстват несигурни за своята информационна безопасност, Termite им дава възможност. Когато уебсайтове се възползват от това, че потребителите не четат техните правила, Termite уведомява потребителите, като ги защитава. Щракнете тук, за да видите нашата кратка демонстрация!

Има някои инструменти и услуги, всички обслужващи собствената си ниша. Всеки от тях върши страхотна работа при решаването на съответните си проблемни пространства. Като цяло пейзажът остава несъвършен. Липсва философски мост между тези различни усилия, оставяйки възможност за по-нататъшно свързване на точките. По-долу са някои съществуващи решения на текущите ни проблеми с поверителността и съответните им недостатъци:

Mozilla Firefox

Mozilla Firefox е уеб браузър с отворен код с „демонстриран“ „приватност на първо място“ „етос“ и е вторият най-голям браузър по пазарен дял. През 2018 г. „комбинираният доход на Mozilla Foundation и Mozilla Corporation“ беше 436 милиона долара. В момента те представляват 7,58% от пазара на браузъри. За сравнение, Google Chrome е най-големият браузър и в момента представлява 68,81% от пазара на браузъри. Mozilla Firefox насърчава въплъщението на компания, която практикува това, което проповядва, когато става въпрос за поверителност.

DuckDuckGo

DuckDuckGo е търсачка, която автоматично криптира връзката на потребителя с уебсайт, когато е възможно (така че вашата лична информация да не може да бъде събрана или компрометирана), блокира рекламни програми за проследяване и предупреждава потребителите за лоши практики за поверителност. Те са класирани като „шестата по големина търсачка“ по пазарен дял, с над 50 милиона потребители. През 2018 г. те бяха оценени между „10–50 милиона долара“ и в момента представляват „1,36% от пазара на търсачките“. За сравнение, Google е най-голямата търсачка и в момента представлява 70,37% от пазара. DuckDuckGo представлява най-всеобхватното и успешно решение на пазара.

Условия за ползване; Не съм прочел (ToS;DR)

"Условия за ползване; Не съм прочел (ToS;DR)» е създаден, за да събира онлайн анализи на политиката за поверителност и оценки за поверителност. Заслужава признание като най-добрият опит да се образоват потребителите относно тяхната поверителност онлайн. Справедливата критика към ToS;DR обаче е, че чрез краудсорсинг на анализи и оценки на политиката, резултатите на уебсайта им липсват последователност. Освен това техният „индекс на теми за поверителност“ обхваща 24 категории, твърде много, за да бъде полезен и удобен за потребителя. Освен това техните анализи се генерират от потребители, което означава, че се извършват ръчно от хора, което води до ограничен обхват на анализите на сайта.

Полиза

Polisis е разширение за chrome, което предоставя на потребителите обобщение на всяка политика за поверителност, базирано на AI. Уникален начин за визуализиране на политиките за поверителност, Polisis използва дълбоко обучение и изкуствен интелект, за да образова потребителите какви данни събира една компания за вас, какво споделя и много повече. Не е нужно да четете пълната политика за поверителност с целия юридически жаргон, за да разберете за какво се регистрирате. По думите на Polisis те твърдят, че техният продукт „позволява мащабируеми, динамични и многоизмерни заявки за политики за поверителност на естествен език. В основата на Polisis е езиков модел, ориентиран към поверителността, изграден със 130K политики за поверителност и нова йерархия от класификатори на невронни мрежи, която отчита както аспектите на високо ниво, така и фините детайли на практиките за поверителност.“ Polisis може да се похвали с над 1000 потребители според Chrome Extension Store. Те разделят своите категории за поверителност на следните 10: 1) Колекция от първа страна, 2) Колекция от трета страна, 3) Достъп, Редактиране, Изтриване, 4), Запазване на данни 5) Сигурност на данните, 6) Конкретни аудитории, 7) Не Проследяване, 8) Промяна на политиката, 9) Друго и 10) Контрол на избора. Въпреки че Polisis е чист инструмент, който използва много интригуващи визуализации на данни, моят опит показва, че е бавен и не е толкова удобен за потребителя.

Privee

Privee е доказателство за концептуалното разширение за браузър, което се стреми да автоматизира анализа на политиките за поверителност. Те се хвалят, че са анализирали 38 522 уебсайта и продължават да нарастват. Над Privee не се работи от 2014 г. и има само 42 потребители в магазина за разширения на Google Chrome. За да обучат моделите си, те разчитат на анотациите на извадки от политиката на ToS;DR. За да разработят и тестват своите модели, те използваха регулярни изрази, за да извлекат подходящи извадки от политики от нови уебсайтове. Следните шест категории за поверителност, които те покриват, включват: 1) Събиране, 2) Шифроване, 3) Проследяване на реклами, 4) Ограничено задържане, 5) Профилиране и 6) Разкриване на реклами.

Иновацията на инструменти като DuckDuckGo и относителният успех на усилията за краудсорсинг (както финансово, така и под формата на аналитични услуги) бележи началото на тенденция. Има нарастващо търсене компаниите да проектират с принципи, свързани с поверителността. При липсата на достатъчно широкообхватна регулация и спазване, академичните среди, частният сектор и гражданското общество демонстрираха, че са готови да отрежат камъка, който е проблемът с поверителността. Независимо от това, трябва да се постигне по-голям напредък в сфери, които все още не са адекватно обхванати.

Този блог е начало на публикация в блог от пет части. В „„Termite Part Two: Model and Feature Choices“ обсъждам дилемите, пред които е изправен нашият екип, и решенията, които неизбежно взехме. Достъп до части три, четири и пет в хипервръзките.