id: Гость   вход   регистрация
текущее время 02:31 02/05/2024
Владелец: unknown (создано 20/02/2013 12:08), редакция от 20/02/2013 12:40 (автор: unknown) Печать
Категории: анонимность
https://www.pgpru.com/Новости/2013/СтилометрическоеВыслеживаниеАвторстаАнонимныхСообщенийВСети
создать
просмотр
редакции
ссылки

20.02 // Стилометрическое выслеживание авторства анонимных сообщений в сети


В течении столетий подверждение авторства пьес Шекспира, Илиады и Одиссеи Гомера были под вопросом.


Сегодня науку, называемую стилометрией, можно использовать для борьбы с хакерами, троллями и создателями вредоносных программ, встречающихся в интернете.


В то же время стилометрия — анализ уникального стиля личных текстов, также может быть использована работодателями для поиска информаторов, заявляющих о злоупотреблениях компании, а также жалобщиков и несогласных.


"Ваш стиль письма делает вашу интернет-анонимность труднодстижимой", говорит американский исследователь, разработавший онлайн-средство анализа стиля текстов.


Исследователи из университета Drexel (Филадельфия) изучали утечки переговоров и данные сотен анонимных пользователей подпольных сетевых форумов.


Они смогли идентифицировать 80% пользователей с применением стилометрического анализа, сопоставляющего стиль письма авторов.


"Большинство людей не беспокоятся о том, насколько чувствителен может быть их стиль письма", говорит Сэдия Эфроз (исследователь и кандидат компьютерных наук).


Результаты этих исследований важны для всех, кто не хочет быть выслеженным по своему стилю письма. "Я прочла множество анонимных сообщений... по поводу весьма конфиденциальных тем (таких как нелегальное употребление наркотиков или конфиденциальная информация о заключённых), что может поставить пишущих в опасное положение, если их личности станут известными", сказала она.


"Люди делятся весьма конфиденциальной информацией, думая, что они анонимны"


В этом также заключены возможности для правоохранительных и государственных агентств в использовании таких техник для расследований на рынке краденного, сетевого мошенничества и средств взлома, хотя для достижения результата потребуется и большой объём данных.


Для проведения анализа требуется минимум 5000 слов, значительно увеличивая список потенциальных целей в американском исследовании. "Золотым стандартом" исследования стали 6500 слов, что было представлено на докладе 29C3 Chaos Communication Congress в декабре в Германии.


Прятки за множеством анонимных аккаунтов больше невозможны, даже если авторы используют различные IP-адреса и кодированные языки, такие как leetspeak, заявляет Afroz.


Выбор слов, структура предложений, синтаксис, пунктуация — всё выявляется.


Австралийский эксперт в области лингвистики Alexis Antonia из университета Ньюкастловского центра компьютерных методов в области литературы и лингвистики отмечает, что особенности характера бессознательно накладывают отпечаток на стиль речи.


"Относительная частота употребления функциональных слов помогает разделить тексты множества авторов".


При применении к подпольному сетевому общению такие находки позволяют идентифицировать создателей вредоносных программ и ботнетов, на основании утечек их переговоров, которые "общедоступны", по заявлению Afroz.


Для измерения приватности и безопасности исследователи создали две программы с открытым исходным кодом — одна из них Jstylo — распознаёт стиль пользователя. Вторая — Anonymouth — используется для "анонимизации" письма путём предоставлению пользователю специфических предложений по смене стиля.


Обе программы свободно доступны в сети.


Источник: Sydney Morning Herald
Источник: Проект JStylo-Anonymouth
Источник: file"Use Fewer Instances of the Letter "i": Toward Writing Style
Источник: fileСлайды
Источник: Видео доклада


 
На страницу: 1, 2, 3, 4 След.
Комментарии [скрыть комментарии/форму]
— Гость (22/02/2013 23:05)   <#>

В средних классах, помнится, любил я рисовать промзоны. Ну там заводы такие с большими черными массивными трубами... Дым во все поля и все такое. Наверное я не все хорошо запомнил из раннего детства?
Хотя нет, смутно помню, поезд, какое-то купе, группа студентов из Нигерии и я в шортиках и панамке.
Главное, чтобы Лейла Александровна не читала эти строки, за отца, знаете ли, боязно...


Согласен. Но речь идет об эксперименте. Следовательно, для его чистоты наличие косвенных улик прочих факторов не нужно. Чего там кого-то профилировать по стилистике и написанию, если у него куки и айпишник статический?
Отсюда цифры в 80-90% успеха маловероятны. За счастье 10-20%.


Принимается. Но много второстепенных факторов, которые играют не последнюю роль. Что за форум, есть ли профиль или сообщения анонимные, где этот пользователь еще постит, что, когда, как, на какие темы и т. д.


Я заметл;)


Верное замечание.

Эта тема как раз смежная с так нелюбимыми вами гуманитариями. Гуманитарная составляющая сквозь призму статистики и набора правил. Что ж, кое-что статистика в любом случае покажет. Однако, какие из этого выводы можно будет сделать, вопрос другой.
Возможно, главный момент, как и в технических вопросах применительно к анонимности в сети, невозможность привязки и идентификации. Т. е. определили, допустим, профилировали. Одно лицо пишет здесь, на ачате и на вуман.ру, назовем его условно Кеша, но вот понять, кто он в реале по имеющимся данным невозможно. Нет никаких нитей, ведущих к его реальной личности.
— Гость (22/02/2013 23:35)   <#>
Одно лицо пишет здесь, на ачате и на вуман.ру, назовем его условно Кеша, но вот понять, кто он в реале по имеющимся данным невозможно.

Кеша уже частично запрофилировался: гомофоб, нацист, педоборец и начинающий линуксоид одновременно. :) Чем больше пишешь на форуме, тем чётче становится портрет, и уже список тех, среди которых стоит искать. Если же пользователь ещё и выдаёт навыки вдадения определённым уникальным знанием (будь то технические тонкости или доскональное знание какие-то конкретных моментов), его становится найти ещё проще, так как список всех людей, этим знанием обладающих, невелик и сильному противнику известен.
— Гость (22/02/2013 23:42)   <#>
В средних классах, помнится, любил я рисовать промзоны. Ну там заводы такие с большими черными массивными трубами... Дым во все поля и все такое. Наверное я не все хорошо запомнил из раннего детства?
В некоторых странах штатные школьные психологи систематически беседуют с детьми и допытываются, что там и как внутри семьи происходит, а то вдруг, мало ли чего. Даже отказ родителей разрешить ребёнку поехать с классом (кое-где таких поездок много, организованы они плохо и вообще не очень осмысленны) — уже повод для разбирательства. Чуть что — жалоба Лейле в полицию. Интересно, отстоит ли народ запрет на введение ювеналки в России, которая будет проверять, достаточно ли йогуртов в холодильнике, или уже пора прав лишать.
— Гость (22/02/2013 23:44)   <#>
пурга и брожение умов!
определите писал ли я здесь, на форуме, хоть раз?
научно-лабораторные изыски, пля
!
— Гость (22/02/2013 23:54)   <#>
Кеша уже частично запрофилировался:
бред. типа начальных пасылов на основе "имя-стиль написания". не было бы "кеша", % идентификации уменьшился бы до 10. и то только из-за того, что тематика сообщений объединяет.
— Гость (23/02/2013 11:41)   <#>
Вот ещё похожий проект. Васи Пупкины как никогда близки к деанону во всех интернетах страны.
— Гость (23/02/2013 12:11)   <#>
Кеша уже частично запрофилировался:

Профиль Кеши – порядка 60 сообщений, из них – три на кому-то близкие, а кому-то ненавистные темы, по которым идет суждение. Имя наверняка вымышленное, если он интересовался ИБ, в первых сообщениях он интересовался прозрачной торификацией всего трафика – соответственно выходил через TOR, так же писал что не особо доверяет TORу и периодически пользуется вдовесок гейтами i2p. Имя вымышленное – т.к. сам ржал над ответами в духе "Кеша, прекратите". Ну и тд. После чего решил самоликвидироваться. А теперь попробуйте разобраться кто он и что. Может он пишет так же, но от имени незарегистрированных гостей или перерегистрируется, но не Кеша, а Гоша. Мало ли. А может и какой-то тролль зарегистрирует себе провокационный акк "НеКеша" и будет троллить всех, приписывая самому Кеше свои заслуги. Ну тут много вариаций событий. Детектить по тексту можно наверное только Мицгола и то, не факт, что он сам не тролль, который в жизни, рабочей и дружеской переписке ведет себя иначе. А вот проявление коллективного бессознательного у незарегистрированных юзеров, которые почему-то чувствуют себя выше, анонимнее и по наитию ведуться на провокаторов, принимая сторону то одних, то других, в зависимости по какую сторону баррикады больше таких же "анонов".
— Гость (23/02/2013 13:48)   <#>
И не надо путать национализм с нацизмом.
— Гость (23/02/2013 14:50)   <#>
И не надо путать национализм с нацизмом.

Да вот в том то и дело – это подмена понятий. И сейчас звучит как оскорбление, так же как и "гомофоб" и "педоборец". Как буд-то люди просто обязаны любить пидорасов и педофилов, а если не любят – то все. Так же и национализм – это всего-лишь люди, которые из всех наций отдают предпочтение своей нации. А тут да, человек высказался о терроризме, пусть и сомнительный человек в плане авторитета на форме – но он сразу оказался нацистом. Я даже уже внимание не обращаю и свое мнение не высказываю, т.к. известно, кто пропагандирует подмену понятий и к чему это в конце-концов приведет.
На счет Кеши. Да – он конечно перегнул, надо было не передергивать тематику форума, но тем не менее – он просто взял и ушел, не стал срать кирпичами и орать на несправедливость суждений.
— Кешуля (23/02/2013 14:59)   <#>
Я – Кеша, мне на все плевать, я ненавижу ослоебов, пидоров и педофилов. Я люблю жаренную картошку, линукс и приватность. Я вычислю IP каждого пидорас, чурки и педофила и тогда им несдобровать!
— Инокентий (23/02/2013 15:06)   <#>
Нет, Кеша – это я! Я уже вычислил твой IP! Жди меня, и пряч осла в шкаф, погарый чурка-ослоеб!
— Гость (23/02/2013 15:28)   <#>
Так же и национализм – это всего-лишь люди, которые из всех наций отдают предпочтение своей нации.

нет, национализм завязан на национальность.
понятием нации оперирует нацизм.
дальше уже википедия подскажет.
— Гость (23/02/2013 15:38)   <#>
А вот проявление коллективного бессознательного у незарегистрированных юзеров, которые почему-то чувствуют себя выше, анонимнее и по наитию ведуться на провокаторов, принимая сторону то одних, то других, в зависимости по какую сторону баррикады больше таких же "анонов".

Это бригада, неужели не заметно? Инновационно расшатывают форум, прикидываются всеми подряд. Впрочем их семя попало в унавоженное писателем простыней поле, занимательно, что администрация тоже стоя хлопает в ладоши.
— Гость (23/02/2013 16:34)   <#>
Это бригада, неужели не заметно?

Да, заметил конечно, вот только неоднозначное мнение остается после них..
Когда начинают троллить людей, когда просто откровенную чушь пишут и тд.
Я конечно понимаю, все здорово и круто – когда на ресурсе не нужна регистрации – туда будет писать больше людей, вот только качество письма не улучшается.
Кстати, мне лично Кешу жалко, хотя он не прав был задавая вопросы, предварительно не ознакомившись даже с изначальными азами работы с linux. А жалко потому, что плохого он ничего не сделал, вроде как даже вежлив был всегда, и поступил нормально – выпилил себя и все.
А парой постов выше – то, о чем я писал ранее – несколько типов петросянят выдавая себя за него.
На счет национализма – не надо ссылаться на Википедию, просто делаем вывод – либо ты сам – представитель неруси, либо просто сторонник какого-либо толерантного течения. Кеша конечно загнул с уничтожением чурок, т.к. среди них тоже есть более-менее адекватные люди, но наказания они заслуживают почти поголовно.
— unknown (23/02/2013 19:33)   профиль/связь   <#>
комментариев: 9796   документов: 488   редакций: 5664
Одно лицо пишет здесь, на ачате и на вуман.ру, назовем его условно Кеша, но вот понять, кто он в реале по имеющимся данным невозможно.

Одно лицо пишет служебные записки, сухим, официальным, и казалось бы стандартным языком. Это же лицо анонимно пишет в отвязно-слэнговом стиле где-то в другом месте. Исследователям удавалось распознавать и такие случаи.

А проверить чиновников или, к примеру, военных на принадлежность текстов в случае подозрения по какому-то конкретному вопросу (как в случае с аналитиком разведки Брэдли Мэннингом) станет проще.

Слежка не опирается только на что-то одно. Это лишь ещё один из методов в комплексе мероприятий по профилированию, установлению круга связей, интересов и др.
На страницу: 1, 2, 3, 4 След.
Ваша оценка документа [показать результаты]
-3-2-1 0+1+2+3