Профилирование в реальной жизни по квазиидентификаторам


Попалась на глаза работа "Routes for breaching and protecting genetic privacy[link1]", Yaniv Erlich, Arvind Narayanan.

Institute for Biomedical Research, Nine Cambridge Center, Cambridge Department of Computer Science, Princeton University.

Генетические аспекты сравниваются с профилированием в реальной жизни. Отбросим в сторону генетику и посмотрим на самую простую и понятную таблицу в публикации.

Средняя энтропия квазиидентификаторов жителей США:

IDbit
пол1.0
этническая группа1.4
цвет глаз1.4
группа крови/резус2.2
штат5.0
рост5.0
год рождения6.3
день и месяц рождения8.5
фамилия12.9
zip-код (почтовый индекс)13.8
данные аутосомальной ДНК28.2

Сложим всё, кроме данных ДНК:

1.0 + 1.4 + 1.4 + 2.2 + 5.0 + 5.0 + 6.3 + 8.5 + 12.9 + 13.8 = 57.5

257.5 = 203809653520824722

В США живёт 316862000 жителей.

Даже парадокс близнецов мало поможет спрятаться, тем более он даёт в большинстве только второго похожего:

2(57.5/2) = 451452825

С учётом всех погрешностей, запас по точности профилирования всё равно большой.

А если теперь представить, что наблюдатель может:

  1. Заполнить максимально полные базы данных по квазиидентификаторам всего населения.
  2. Запустить системы слежения за квазиидентификаторами в реальной жизни, по метаданным в каналах связи.
  3. Работать с персонализированными квазиидентификаторами (предпочтения, привычки, покупки, паттерны поведения, маршруты перемещений).
  4. Обрабатывать эти данные.
  5. Строить графы связей между носителями квазиидентификаторов.

Причём всё это тривиальные общеизвестные факты, можно было лет ~дцать тому назад обо всём догадаться и сделать выводы о возможности существования подобных программ.

P.S.: В работе встречается аббревиатура PGP — Personal Genome Project, данные о персональном геноме предлагается защищать гомоморфным шифрованием.

Комментарии
Гость (17/10/2013 01:08)   

Всё идёт к этому: «…и нельзя будет никому ни продать, ни купить…» © апокалипсис.
Гость (17/10/2013 03:48)   
А если теперь представить, что наблюдатель может:

Заполнить... Запустить... Работать... Обрабатывать... Строить графы связей между носителями квазиидентификаторов.

Если вы имеете ввиду Всевышнего, то, пожалуй, возможности описаны актуально.


Судя по цитате — финансовый. Мы Можем Многое!


...Квазиунофантазия. Ну, это всем понятно.


А вообще за статью, как всегда, спасибо. Почитаем, что там пишут заокеанские ученые. Уже и до IRL добрались, черти.

P.S. Ученым неплохо было бы привести сравнение вероятности различных сценариев (тотальный контроль, слабое профилирование, избирательное слежение/вычисление), в т. ч. по годам и юрисдикциям. А так сказка ложь. И былью её сделать нереально архисложно. Впрочем, намек никуда не исчезает. Эдакий техногенный техногенетический вуайеризм в промышленных масштабах. В масштабах страны. В интересах каждого. В масштабах каждого. В интересах страны. ©
Гость (17/10/2013 13:31)   

Не всем.
Гость (31/10/2013 04:29)   
Про Принцип неопределённости Гайзенбе́рга[link2] товарищи чекисты всех стран решили "забыть" ?

Особенно про эксперимент Щель в экране[link3]
Гость (31/10/2013 04:35)   
Надоела эта кириллица
вот оригинал с вики[link4]
смысл в том что пока мы наблюдаем за электроном он ведет себя как частица, но стоит перестать за ним наблюдать он ведет себя как волна...
И как они[link5] это будут контролировать своими видеокамерами и другими сканерами?
— ФСБ (31/10/2013 04:52)   
В пределах погрешности всё ОК, не разводите панику.
Гость (01/11/2013 01:53)   


.. которой достаточно, чтобы "назначить крайнего" который виноват в том, что просто оказался в ненужном месте в ненужное время!


Скажите об этом матерям Ковалева и Коновалова, расстрелянных в Беларуси !
Гость (01/11/2013 04:18)   
Технически всегда можно добиться столь малой погрешности, которая будет приемлемой, а фабриковать доказательства всегда было можно и будет можно безотносительно тех. средств.
Гость (01/11/2013 23:11)   
технически всегда можно добиться столь малой погрешности, которая будет приемлемой
это как в "В круге первом" – множество подозреваемых сократилось до 2-х, думали-думали, да и посадили обоих, для надежности.
Гость (03/11/2013 09:46)   
думали-думали, да и посадили обоих, для надежности.
А во Франции только одного[link6].
Гость (23/07/2014 17:26)   
Новое – хорошо забытое старое :

Конечно, запаха человека вообще не бывает, так же как не бывает человеческого лица вообще. Каждый человек пахнет по-своему, никто не понимал этого лучше, чем Гренуй, который знал тысячи индивидуальных запахов и с рождения различал людей на нюх. И все же, с точки зрения парфюмерии, была некая основная тема человеческого запаха, впрочем довольно простая: потливо-жирная, сырно-кисловатая, в общем достаточно противная основная тема, свойственная в равной степени всем людям, а уж над ней в более тонкой градации колышутся облачка индивидуальной ауры.
© Парфюмер

Ссылки
[link1] http://arxiv.org/abs/1310.3197

[link2] https://ru.wikipedia.org/wiki/Принцип_неопределённости

[link3] http://www.wikiznanie.ru/ru-wz/index.php/Принцип_неопределённости_Гейзенберга#.D0.A9.D0.B5.D0.BB.D1.8C_.D0.B2_.D1.8D.D0.BA.D1.80.D0.B0.D0.BD.D0.B5

[link4] https://ru.wikipedia.org/w/index.php?title=Принцип_неопределённости

[link5] http://www.fsb.ru

[link6] https://www.pgpru.com/comment62718