id: Гость   вход   регистрация
текущее время 09:34 02/05/2024
Владелец: unknown (создано 20/02/2013 12:08), редакция от 20/02/2013 12:40 (автор: unknown) Печать
Категории: анонимность
https://www.pgpru.com/Новости/2013/СтилометрическоеВыслеживаниеАвторстаАнонимныхСообщенийВСети
создать
просмотр
редакции
ссылки

20.02 // Стилометрическое выслеживание авторства анонимных сообщений в сети


В течении столетий подверждение авторства пьес Шекспира, Илиады и Одиссеи Гомера были под вопросом.


Сегодня науку, называемую стилометрией, можно использовать для борьбы с хакерами, троллями и создателями вредоносных программ, встречающихся в интернете.


В то же время стилометрия — анализ уникального стиля личных текстов, также может быть использована работодателями для поиска информаторов, заявляющих о злоупотреблениях компании, а также жалобщиков и несогласных.


"Ваш стиль письма делает вашу интернет-анонимность труднодстижимой", говорит американский исследователь, разработавший онлайн-средство анализа стиля текстов.


Исследователи из университета Drexel (Филадельфия) изучали утечки переговоров и данные сотен анонимных пользователей подпольных сетевых форумов.


Они смогли идентифицировать 80% пользователей с применением стилометрического анализа, сопоставляющего стиль письма авторов.


"Большинство людей не беспокоятся о том, насколько чувствителен может быть их стиль письма", говорит Сэдия Эфроз (исследователь и кандидат компьютерных наук).


Результаты этих исследований важны для всех, кто не хочет быть выслеженным по своему стилю письма. "Я прочла множество анонимных сообщений... по поводу весьма конфиденциальных тем (таких как нелегальное употребление наркотиков или конфиденциальная информация о заключённых), что может поставить пишущих в опасное положение, если их личности станут известными", сказала она.


"Люди делятся весьма конфиденциальной информацией, думая, что они анонимны"


В этом также заключены возможности для правоохранительных и государственных агентств в использовании таких техник для расследований на рынке краденного, сетевого мошенничества и средств взлома, хотя для достижения результата потребуется и большой объём данных.


Для проведения анализа требуется минимум 5000 слов, значительно увеличивая список потенциальных целей в американском исследовании. "Золотым стандартом" исследования стали 6500 слов, что было представлено на докладе 29C3 Chaos Communication Congress в декабре в Германии.


Прятки за множеством анонимных аккаунтов больше невозможны, даже если авторы используют различные IP-адреса и кодированные языки, такие как leetspeak, заявляет Afroz.


Выбор слов, структура предложений, синтаксис, пунктуация — всё выявляется.


Австралийский эксперт в области лингвистики Alexis Antonia из университета Ньюкастловского центра компьютерных методов в области литературы и лингвистики отмечает, что особенности характера бессознательно накладывают отпечаток на стиль речи.


"Относительная частота употребления функциональных слов помогает разделить тексты множества авторов".


При применении к подпольному сетевому общению такие находки позволяют идентифицировать создателей вредоносных программ и ботнетов, на основании утечек их переговоров, которые "общедоступны", по заявлению Afroz.


Для измерения приватности и безопасности исследователи создали две программы с открытым исходным кодом — одна из них Jstylo — распознаёт стиль пользователя. Вторая — Anonymouth — используется для "анонимизации" письма путём предоставлению пользователю специфических предложений по смене стиля.


Обе программы свободно доступны в сети.


Источник: Sydney Morning Herald
Источник: Проект JStylo-Anonymouth
Источник: file"Use Fewer Instances of the Letter "i": Toward Writing Style
Источник: fileСлайды
Источник: Видео доклада


 
На страницу: 1, 2, 3, 4 След.
Комментарии [скрыть комментарии/форму]
— Гость (23/02/2013 20:30)   <#>
все здорово и круто – когда на ресурсе не нужна регистрации – туда будет писать больше людей, вот только качество письма не улучшается.
вы серьезно думаете, что регистрация это фильтр от дураков?
Исследователям удавалось распознавать и такие случаи.
кто анализирует? машина? алгоритм кто создавал? человек? ну один человек создал одно, другой – другое. полиграф тоже обманывают, хоть и говорят что это не возможно. извечное противостояние пули и бронежилета.
— unknown (23/02/2013 20:50, исправлен 23/02/2013 20:53)   профиль/связь   <#>
комментариев: 9796   документов: 488   редакций: 5664

В новости по ссылкам выложена и программа для обмана распознавания. Исследователи объясняют её разработку тем, что без изучения методики обмана не удалось бы продвинуться и в создании самого алгоритма распознавания.



Статистические отпечатки можно анализировать и вручную (выбирая степень подробности представления данных по конкретным случаям) и автоматически.



Принципиальное отличие от полиграфа и психологических тестов в том, что здесь нет цели по внешним признакам понять, что у человека "в голове".


Подделать письменный почерк тоже возможно, но если определение особенностей характера или поведения по почерку ближе к псевдонауке или ремеслу, то распознавание образцов почерка на схожесть с одним и тем же человеком более формализуемо. Аналогия примерно в этом.

— Гость (23/02/2013 21:15)   <#>

Шуток не понимаете?


известно, кто пропагандирует подмену понятий и к чему это в конце-концов приведет.


Всегда вызывало ассоциации: страна завязана на гражданство и территорию; понятием гражданства оперирует нацизм; дискриминация прав по наличию гражданства — геноцид. Дальше уже ООН подскажет, имеют ли страны право на такой вид дискриминации. :)


В правительстве примерно так же рассуждают: если ратуешь за анонимность, значит, есть что скрывать, т.е. ты либо преступник сам, либо заинтересован в покрытии других преступников, а кто есть преступники, и что считать преступлением, решим мы, правительство, сами.


Если кому-то раскрытие личности грозит настолько сильно, всегда можно попросить постороннего полностью переписать текст с нуля своими словами.
— Гость (23/02/2013 21:27)   <#>
все здорово и круто – когда на ресурсе не нужна регистрации – туда будет писать больше людей, вот только качество письма не улучшается.
вы серьезно думаете, что регистрация это фильтр от дураков?
Поддерживаю. Фильтр от дураков — модераторы/редакторы/редколлегия/ещё что-то такое, а наличие/отсутствие регистрации или очерчивание круга тех, кому можно постить — меры, не имеющие практически никакого отношения к заявленной цели. Я много где мог бы вставить свои пять копеек по существу дела (уровень многих интернет-дискуссий в области моей компетентности ниже плинтуса), но мне лень регистрироваться на каком-то там форуме, чтобы написать пару постов, даже если оставить за рамками вопрос анонимности.

распознавание образцов почерка на схожесть с одним и тем же человеком более формализуемо.
Говорят, что при криминалистическом анализе подписи на документах учитвается много чего помимо самого почерка, вплоть до оставленных образцов ДНК на листе бумаги.
— Гость (23/02/2013 22:03)   <#>
Ещё подумалось:
Что значит авторство? Фразы, которыми пишет индивид, не берутся с потолка, не заложены с рождения; они меняются с возрастом, зависят от окружения. Иногда говорят в лоб «у кого ты этих словечек набрался?». Фактически писатель компилирует текст из других текстов, ранее им прочитанных, привнося какую-то долю персональности. Если среди прочитанных текстов превалирует один стиль, тексты индивида тоже будут написаны в том же стиле, а различение авторства сведётся к различению стилей. Вот профилирование по ошибкам более интересно, поскольку есть идеально анонимный (по ошибкам) текст — текст, написанный по правилам официальной грамматики. Правда, можно сказать, что можно выделить группы людей и по типу ошибок, что аналогично стилю.

Интересен и ещё такой момент: пусть известны образцы чьей-то устной речи, и требуется определить авторство письменной (или наоборот). Можно задачу и в полной аналогии поставить: определять авторство устной речи по известным образцам устной речи при условии, что устная речь записана позже письменно, и никаких других характеристик речи неизвестно (голос, паузы, заикания). Такой тип вопросов возникает, потому что у многих устная и письменная речь сильно разнятся, хотя и влияют друг на друга (в частности, чем ближе речь к длинному официальному монологу, тем ближе она к письменной).
— Гость (13/03/2013 00:31)   <#>
— Гость (13/03/2013 01:31)   <#>
И в чём смысл этой картинки, Гость (13/03/2013 00:31)?
— Гость (18/03/2013 10:37)   <#>
Проги только для инглиша работают?
— Гость (10/05/2013 02:12)   <#>
Все же наверное стоило разместить ссылку и на доклад с 29c3, о котором упоминается в тексте – https://www.youtube.com/watch?v=xL9aam3ZUlk
— Гость (31/08/2013 11:50)   <#>

Можно будет найти этого постороннего и через него выйти на исходного автора, например попросив раскрыть переписку.
— Гость (31/08/2013 20:40)   <#>

Этот посторонний может не знать автора и оказывать услуги анонимно, анонимно принимая и оплату за них.
— Гость (31/08/2013 21:30)   <#>
Автора может не знать, а исходный текст может и не удалять.
— Гость (31/08/2013 21:33)   <#>
Потому как при некоторых текстах крайним быть очень не захочется...
— Гость (31/08/2013 23:59)   <#>

Раскопают ли автора по стилометрии — это ещё бабка надвое сказала, а вот хранить оригинал текста — улика в пособничестве.
— Гость (01/09/2013 09:01)   <#>
В таком деле лучше быть уличённым в пособничестве, чем в организаторстве, поэтому переписку и контакты скорее будут сохранять, в укромном месте, на всякий случай – больше будет возможностей для торговли со следствием.
На страницу: 1, 2, 3, 4 След.
Ваша оценка документа [показать результаты]
-3-2-1 0+1+2+3