20.02 // Стилометрическое выслеживание авторства анонимных сообщений в сети
В течении столетий подверждение авторства пьес Шекспира, Илиады и Одиссеи Гомера были под вопросом.
Сегодня науку, называемую стилометрией, можно использовать для борьбы с хакерами, троллями и создателями вредоносных программ, встречающихся в интернете.
В то же время стилометрия — анализ уникального стиля личных текстов, также может быть использована работодателями для поиска информаторов, заявляющих о злоупотреблениях компании, а также жалобщиков и несогласных.
"Ваш стиль письма делает вашу интернет-анонимность труднодстижимой", говорит американский исследователь, разработавший онлайн-средство анализа стиля текстов.
Исследователи из университета Drexel (Филадельфия) изучали утечки переговоров и данные сотен анонимных пользователей подпольных сетевых форумов.
Они смогли идентифицировать 80% пользователей с применением стилометрического анализа, сопоставляющего стиль письма авторов.
"Большинство людей не беспокоятся о том, насколько чувствителен может быть их стиль письма", говорит Сэдия Эфроз (исследователь и кандидат компьютерных наук).
Результаты этих исследований важны для всех, кто не хочет быть выслеженным по своему стилю письма. "Я прочла множество анонимных сообщений... по поводу весьма конфиденциальных тем (таких как нелегальное употребление наркотиков или конфиденциальная информация о заключённых), что может поставить пишущих в опасное положение, если их личности станут известными", сказала она.
"Люди делятся весьма конфиденциальной информацией, думая, что они анонимны"
В этом также заключены возможности для правоохранительных и государственных агентств в использовании таких техник для расследований на рынке краденного, сетевого мошенничества и средств взлома, хотя для достижения результата потребуется и большой объём данных.
Для проведения анализа требуется минимум 5000 слов, значительно увеличивая список потенциальных целей в американском исследовании. "Золотым стандартом" исследования стали 6500 слов, что было представлено на докладе 29C3 Chaos Communication Congress в декабре в Германии.
Прятки за множеством анонимных аккаунтов больше невозможны, даже если авторы используют различные IP-адреса и кодированные языки, такие как leetspeak, заявляет Afroz.
Выбор слов, структура предложений, синтаксис, пунктуация — всё выявляется.
Австралийский эксперт в области лингвистики Alexis Antonia из университета Ньюкастловского центра компьютерных методов в области литературы и лингвистики отмечает, что особенности характера бессознательно накладывают отпечаток на стиль речи.
"Относительная частота употребления функциональных слов помогает разделить тексты множества авторов".
При применении к подпольному сетевому общению такие находки позволяют идентифицировать создателей вредоносных программ и ботнетов, на основании утечек их переговоров, которые "общедоступны", по заявлению Afroz.
Для измерения приватности и безопасности исследователи создали две программы с открытым исходным кодом — одна из них Jstylo — распознаёт стиль пользователя. Вторая — Anonymouth — используется для "анонимизации" письма путём предоставлению пользователю специфических предложений по смене стиля.
Обе программы свободно доступны в сети.
Источник: Sydney Morning Herald
Источник: Проект JStylo-Anonymouth
Источник: "Use Fewer Instances of the Letter "i": Toward Writing Style
Источник: Слайды
Источник: Видео доклада
Ложная дилемма. Кроме того, работа за идею не обязана подразумевать отказ от оплаты труда, если последняя предлагается.
комментариев: 11558 документов: 1036 редакций: 4118
комментариев: 9796 документов: 488 редакций: 5664
Интересно. Я кстати замечал, что даже простейшие конфиги и скрипты пишутся с индивидуальными особенностями.
комментариев: 1079 документов: 58 редакций: 59
Может и Сатоши найдется заодно, интересно посмотреть на него)
комментариев: 9796 документов: 488 редакций: 5664
Думаю, что даже по тому как человек составляет команды и выбирает к ним опции в консоли. Вариантов масса, но многие выбирают и запоминают свой, который становится индивидуальным, особенно в сочетаниях с другими командами.
Прикинь, это тоже я был. И конфиги мои. Тебе предстоит сделать ещё много открытий[создать] в тему этой новости — например, узнать, почему хотя никто не подписывается, все тут друг друга прекрасно узнают.
комментариев: 1079 документов: 58 редакций: 59
Гость, давай там, в той же теме. Ну точно не во всех, ок?
Дарова!Здравствуйте! Ключевое слово "анонимным" или"риэлторам""девелоперам"?Спалиться можно на чем угодно, если есть с чем сопоставлять, когда речь идёт о побочке.
Если кодер пишет код только и исключительно анонимно, максимум он может спалиться только как аноним1 = аноним2 с какой-то долей вероятности, стремящей к "чему-то там", но никогда не достигающей "чего-то там" (0 или 1).
А ещё аноним2 может сказать, что аноним1 — это не он, просто аноним3 специально сделал код похожим на код анонима1, чтобы подставить анонима2 (ведь похожесть можно и симулировать).
С какой-то точностью, да и то, только умными программами если:
Анонимизироваться — это более простая задача, чем сымитировать кого-то, но даже эту задачу народ с треском провалил.