Въведение в диференциалната поверителност

Технологията позволява на компаниите да събират повече данни и с повече подробности за своите потребители от всякога. Понякога тези данни се продават на трети страни, друг път се използват за подобряване на продукти и услуги.

За да се защити поверителността на потребителите, могат да се използват техники за анонимизиране, за да се премахне всяка част от личните данни и да се даде достъп на анализаторите само до това, което е строго необходимо. Както обаче показа конкуренцията на Netflix през 2007 г., това може да „се обърка“. Богатството от данни позволява идентифициране на потребителите чрез понякога изненадваща комбинация от променливи като датите, на които дадено лице е гледало определени филми. Просто свързване между анонимизирани набори от данни и неанонимизирани (публично достъпни) може да идентифицира повторно анонимизирани данни.

Differential Privacy формализира идеята, че една заявка не трябва да разкрива дали някое лице присъства в набор от данни, още по-малко какви са неговите данни. Представете си два иначе идентични набора от данни, един с вашата информация в него и един без нея. Диференциалната поверителност гарантира, че вероятността дадена заявка да доведе до даден резултат е почти същата, независимо дали се извършва върху първия или втория набор от данни.

По-формално, диференциалната поверителност изисква вероятността заявката да генерира даден изход да се промени най-много с мултипликативен коефициент, когато запис (напр. индивид) се добавя или премахва от входа. Най-значимият мултипликативен фактор определя количеството на разликата в поверителността.

Например, Apple използва локална диференциална поверителност, за да защити поверителността на потребителската активност в даден период от време, като същевременно получава информация, която подобрява интелигентността и използваемостта на такива функции като:

• QuickType предложения

• Предложения за емотикони

• Съвети за търсене

• Домейни, изтощаващи енергия в Safari

• Safari Autoplay Intent Detection (macOS High Sierra)

• Домейни при срив на Safari (iOS 11)

Какво гарантира Differential Privacy?

  • Диференциалната поверителност математически гарантира, че всеки, който види резултата от различен частен анализ, по същество ще направи същото заключение относно личната информация на всяко лице, независимо дали личната информация на това лице е включена във входните данни за анализа.
  • Differential Privacy предоставя математически доказуема гаранция за защита на поверителността срещу широк спектър от атаки за поверителност (включително атаки за разграничаване, атаки за свързване и атаки за реконструкция).

Какво не гарантира?

  • Диференциалната поверителност може да не е подходяща, ако множество примери съответстват на едно и също лице (напр. заявки за търсене, отзиви за ресторанти).

Причини за различна поверителност

Диференциалната поверителност има ценни свойства, които я превръщат в богата рамка за анализиране на чувствителна лична информация и защита на поверителността:

  • Количествено определяне на загубата на поверителност
  • Състав
  • Групова поверителност
  • Затваряне при последваща обработка
  • Диференциални методи за поверителност

Методи за диференциална поверителност

* Механизъм на Лаплас — — › Система за запитване-отговор

* Случаен отговор — — › Събиране на потребителски данни

* Експоненциален механизъм — — › Работа с бази данни

Препратки и научете повече по темата:

https://robertovitillo.com/2016/07/29/differential-privacy-for-dummies/

https://towardsdatascience.com/understanding-differential-privacy-85ce191e198a

https://twimlai.com/twiml-talk-132-differential-privacy-theory-practice-with-aaron-roth/

https://machinelearning.apple.com/docs/learning-with-privacy-at-scale/appledifferentialprivacysystem.pdf

https://www.coursera.org/lecture/security-privacy-big-data-protection/differential-privacy-methods-PyO5J

https://en.wikipedia.org/wiki/Differential_privacy