id: Гость   вход   регистрация
текущее время 15:35 20/04/2024
Владелец: unknown (создано 20/02/2013 12:08), редакция от 20/02/2013 12:40 (автор: unknown) Печать
Категории: анонимность
http://www.pgpru.com/Новости/2013/СтилометрическоеВыслеживаниеАвторстаАнонимныхСообщенийВСети
создать
просмотр
редакции
ссылки

20.02 // Стилометрическое выслеживание авторства анонимных сообщений в сети


В течении столетий подверждение авторства пьес Шекспира, Илиады и Одиссеи Гомера были под вопросом.


Сегодня науку, называемую стилометрией, можно использовать для борьбы с хакерами, троллями и создателями вредоносных программ, встречающихся в интернете.


В то же время стилометрия — анализ уникального стиля личных текстов, также может быть использована работодателями для поиска информаторов, заявляющих о злоупотреблениях компании, а также жалобщиков и несогласных.


"Ваш стиль письма делает вашу интернет-анонимность труднодстижимой", говорит американский исследователь, разработавший онлайн-средство анализа стиля текстов.


Исследователи из университета Drexel (Филадельфия) изучали утечки переговоров и данные сотен анонимных пользователей подпольных сетевых форумов.


Они смогли идентифицировать 80% пользователей с применением стилометрического анализа, сопоставляющего стиль письма авторов.


"Большинство людей не беспокоятся о том, насколько чувствителен может быть их стиль письма", говорит Сэдия Эфроз (исследователь и кандидат компьютерных наук).


Результаты этих исследований важны для всех, кто не хочет быть выслеженным по своему стилю письма. "Я прочла множество анонимных сообщений... по поводу весьма конфиденциальных тем (таких как нелегальное употребление наркотиков или конфиденциальная информация о заключённых), что может поставить пишущих в опасное положение, если их личности станут известными", сказала она.


"Люди делятся весьма конфиденциальной информацией, думая, что они анонимны"


В этом также заключены возможности для правоохранительных и государственных агентств в использовании таких техник для расследований на рынке краденного, сетевого мошенничества и средств взлома, хотя для достижения результата потребуется и большой объём данных.


Для проведения анализа требуется минимум 5000 слов, значительно увеличивая список потенциальных целей в американском исследовании. "Золотым стандартом" исследования стали 6500 слов, что было представлено на докладе 29C3 Chaos Communication Congress в декабре в Германии.


Прятки за множеством анонимных аккаунтов больше невозможны, даже если авторы используют различные IP-адреса и кодированные языки, такие как leetspeak, заявляет Afroz.


Выбор слов, структура предложений, синтаксис, пунктуация — всё выявляется.


Австралийский эксперт в области лингвистики Alexis Antonia из университета Ньюкастловского центра компьютерных методов в области литературы и лингвистики отмечает, что особенности характера бессознательно накладывают отпечаток на стиль речи.


"Относительная частота употребления функциональных слов помогает разделить тексты множества авторов".


При применении к подпольному сетевому общению такие находки позволяют идентифицировать создателей вредоносных программ и ботнетов, на основании утечек их переговоров, которые "общедоступны", по заявлению Afroz.


Для измерения приватности и безопасности исследователи создали две программы с открытым исходным кодом — одна из них Jstylo — распознаёт стиль пользователя. Вторая — Anonymouth — используется для "анонимизации" письма путём предоставлению пользователю специфических предложений по смене стиля.


Обе программы свободно доступны в сети.


Источник: Sydney Morning Herald
Источник: Проект JStylo-Anonymouth
Источник: file"Use Fewer Instances of the Letter "i": Toward Writing Style
Источник: fileСлайды
Источник: Видео доклада


 
На страницу: 1, 2, 3, 4 След.
Комментарии [скрыть комментарии/форму]
— Гость (01/09/2013 11:35)   <#>
Те, кто заранее готовятся к торговле со следствием, такие услуги не оказывают.
— Гость (01/09/2013 22:38)   <#>
Те, кто не готовится, либо идейны, либо глупы. Первых не купишь, а вторые не напишут ничего толкового.
— Гость (01/09/2013 22:59)   <#>

Ложная дилемма. Кроме того, работа за идею не обязана подразумевать отказ от оплаты труда, если последняя предлагается.
— SATtva (22/01/2015 10:26)   профиль/связь   <#>
комментариев: 11558   документов: 1036   редакций: 4118
Привет анонимным девелоперам.

Our results. We used a dataset with 250 programmers that had an average of 630 lines of code per programmer. We used a combination of lexical features (e.g., variable name choices), layout features (e.g., spacing), and syntactic features (i.e., grammatical structure of source code), resulting in a 95% accuracy at attributing an anonymous piece of code to one of 250 programmers. <...> In another study, with a smaller dataset of 30 programmers and an average of 1,910 lines of code per programmer, file97% accuracy was reached.
— unknown (22/01/2015 11:11, исправлен 22/01/2015 11:11)   профиль/связь   <#>
комментариев: 9796   документов: 488   редакций: 5664

Интересно. Я кстати замечал, что даже простейшие конфиги и скрипты пишутся с индивидуальными особенностями.

— ressa (22/01/2015 11:38)   профиль/связь   <#>
комментариев: 1079   документов: 58   редакций: 59
Ого, а я не верил Гостю, когда он говорил о том, что по конфигам спалиться можно((
Может и Сатоши найдется заодно, интересно посмотреть на него)
— unknown (22/01/2015 12:03)   профиль/связь   <#>
комментариев: 9796   документов: 488   редакций: 5664

Думаю, что даже по тому как человек составляет команды и выбирает к ним опции в консоли. Вариантов масса, но многие выбирают и запоминают свой, который становится индивидуальным, особенно в сочетаниях с другими командами.
— Гость (23/01/2015 05:19)   <#>

Прикинь, это тоже я был. И конфиги мои. Тебе предстоит сделать ещё много открытий[создать] в тему этой новости — например, узнать, почему хотя никто не подписывается, все тут друг друга прекрасно узнают.
— ressa (23/01/2015 12:25)   профиль/связь   <#>
комментариев: 1079   документов: 58   редакций: 59

Гость, давай там, в той же теме. Ну точно не во всех, ок?
— Гость (24/01/2015 18:37)   <#>

Дарова! Здравствуйте! Ключевое слово "анонимным" или "риэлторам" "девелоперам"?


Спалиться можно на чем угодно, если есть с чем сопоставлять, когда речь идёт о побочке.

Если кодер пишет код только и исключительно анонимно, максимум он может спалиться только как аноним1 = аноним2 с какой-то долей вероятности, стремящей к "чему-то там", но никогда не достигающей "чего-то там" (0 или 1).
— Гость (25/01/2015 00:36)   <#>

А ещё аноним2 может сказать, что аноним1 — это не он, просто аноним3 специально сделал код похожим на код анонима1, чтобы подставить анонима2 (ведь похожесть можно и симулировать).
— Гость (25/01/2015 01:08)   <#>
Стиль можно эмулировать. НЕТ?
— Гость (25/01/2015 04:55)   <#>

С какой-то точностью, да и то, только умными программами если:

Most of these features are very low level features, for example, frequencies of character uni-/bi-/tri-grams. Providing effective suggestions for such low level features is challenging. Changing existing documents by following those suggestions to hide author specific features is also very difficult. For this reason, none of the participants in our study were able to anonymize themselves using the Writeprints (Limited) features.

Анонимизироваться — это более простая задача, чем сымитировать кого-то, но даже эту задачу народ с треском провалил.
На страницу: 1, 2, 3, 4 След.
Ваша оценка документа [показать результаты]
-3-2-1 0+1+2+3