изменение голоса при телефонных разговорах

На сколько эффективно против автоматического рапознавания в китайских телефонах с встроенной функцией? Есть под андройд, симбиан, блекберри?

Комментарии

— SATtva (28/05/2014 16:28)
Вокодеры обсуждались отсюда^[link1] и далее.

— Гость (29/05/2014 00:52)
Не нашел в этой теме ни намека на решение. Кроме того хотелось бы нормальный ответ в духе практической безопасности:
1. Да, китайские трубы решают – список моделей.
2. Вот такой софт под эти ос 1, 2, 3...
3. Все это туфта и на рынке нет нормального решения :(
И ссылочки:
1. Каким образом можно идентифицировать по голосу.
2. Принципы используемые для изменения голоса.

— Гость (29/05/2014 02:57)
/comment79192^[link2] & /comment66289^[link3]. Ищите в этих постах слово «вокодер». Как я понял, даже с софтом для ПК всё не очень просто, понятно и безопасно, а уж про софт на телефонах — тем более.

> Принципы используемые для изменения голоса.

По ссылкам это есть. Есть даже пробный mp3^[link4]-фaйл с записью изменённого голоса от gegel'я.

P.S. Я понимаю, что 29 страниц топика — это много, но ведь надо вам, а не мне. Почему я за вас должен их лопатить, выискивая конкретные цитаты?

— gegel (04/06/2014 19:52)
Конретно по поводу встроенной голосоменялки в GSM-телефонах Donod C3+
была отдельная ветка, позже подзабытая. Там есть ссылка на мой пример работы вокодера на "голосе Евы": /comment72906^[link5].
Кстати, позже я вник в работу William Andrew Burnson^[link6] и адаптировал LPC-кодек от SpeakFreely для работы в качестве вокодера, меняя параметры-описатели после кодирования фрейма голоса и затем раскодируя. Получаются неплохие эффекты, но вопрос, на сколько это недоказуемо, открыт.
Дело в том, что для голосовой идентификации в forensic-софте используются статистические методы (например, Hidden Markov model). Т.о., при частичной смене описателей голоса все равно заданная вероятность ошибки нулевой гипотезы будет достижима при наличии определенного количества оригинального и тестируемого голоса, что может быть принято судом в качестве доказательства.
Поэтому стоит помнить, что возможность идентификации пропорциональна длительности разговора.

— SATtva (04/06/2014 20:17)
Почему бы в таком случае вокодеру автоматически не изменять параметры кодирования голоса через некоторые интервалы времени в процессе разговора?

— Гость (04/06/2014 20:41)
Короче, ребята, всё – уныло. Хотелось бы конечно правдоподобного изменения голоса при разговоре по телефону. Но, увы, не так всё просто, хоть и 21 век на дворе.

— Гость (04/06/2014 20:43)
Придется говорить через тяпочку. Или нос пальцами зажимать :)

— gegel (04/06/2014 21:39, исправлен 04/06/2014 21:48)

Почему бы в таком случае вокодеру автоматически не изменять параметры кодирования голоса через некоторые интервалы времени в процессе разговора?

Именно так и делается. Но изменить ВСЕ параметры невозможно – от голоса ничего не останется. Изменяются параметры частично в той степени, чтобы голос оставался по крайней мере разборчивым. И даже если эти параметры частично случайны, то все равно при статистическом анализе достаточно больших последовательностей можно с заданной вероятностью определить скрытые от наблюдателя индивидуальные факторы: размер глотки, языка, связок и т.п. Для этого и применяется Hidden Markov model.
Теоретически, наверное, можно поступать по другому: выявить связи между индивидуальными анатомическими факторами и описателями и затем менять описатели уже целенаправленно по созданному алгоритму, подгоняя их под виртуальные факторы иммитируемого голоса. Наверняка такие исследования проводились, но, конечно, в открытом доступе ни научных публикаций, ни тем более практических алгоритмов нет.
Как пример – веб-сервисы с возможностью трансформации вашего голосового ролика в голос известных артистов или политиков. Опять же, без подробного описания используемых алгоритмов о надежности транформации речь не идет.

Но, увы, не так всё просто, хоть и 21 век на дворе.

Поэтому и непросто: технологии идентификации совсем другие А что в 22-м будет?
Например, до сих пор иногда военные пользуют старые ЗАС, переставляющие формантные зоны, и очень удивляются, когда их ломают.

— Гость (04/06/2014 23:39)

> до сих пор иногда военные пользуют старые ЗАС

это от бедности.

— Гость (05/06/2014 18:10)

>Поэтому и непросто: технологии идентификации совсем другие А что в 22-м будет?

Да фик с ней, с идентификацией. Чтоб ее провести нужно еще примерно понять кто говорит, откуда, "принять" этого человека. Хотя б просто была б возможность изменить голосок на другой (реальный, человеческий), как можно сделать это в скайпе, к примеру. Я не идентификацию имел ввиду :)

— Гость (10/06/2014 00:25)

> позже я вник в работу William Andrew Burnson

Глянул на главную страницу сайта, а там...

Real-Time Voice Conversion: A Multirate 8kHz LPC Vocoder, Project Paper, 2011

Algorithm incorporated into the TORFone Secure VoIP Tool^[link7] — Demo^[link8]

> Получаются неплохие эффекты, но вопрос, на сколько это недоказуемо, открыт.

Вообще, надо различать две задачи:

Хочу, чтоб меня не узнали на слух люди, которые меня знают.
Хочу, чтобы экспериза не смогла доказать, что это говорил я, даже при том, что у экспертизы есть множество неизменённых записей моего голоса.

> Как пример – веб-сервисы с возможностью трансформации вашего голосового ролика в голос известных артистов или политиков.

Т.е. такие веб-сервисы существуют?

> Чтоб ее провести нужно еще примерно понять кто говорит, откуда, "принять" этого человека.

Хинт: голосовой банк данных^[link9]. Скоро все там будем, если не уже. Самые отпетые уже более 10-ти лет^[link10] там.

— tr18437s (20/06/2015 00:53)
Вообще интересно сделать невозможным автоматизированное сравнение голоса с имеющимися образцами. Необязательно программно. Может быть достаточно потуже затянуть галстук?:) Что скажут спецы?

— pgprubot (20/06/2015 10:56)

> сделать невозможным автоматизированное сравнение голоса с имеющимися образцами.

> Что скажут спецы?

Это задача типа той, когда о человеке неизвестно ничего, но его надо найти по голосу, сравнивая его с тысячами образцов. Мне кажется, в реальности обычно решается другая задача: о человеке помимо его голоса известно много что, это сужает круг поиска и даже, возможно, ограничивает его буквально несколькими лицами, а вот сравнить с голосами этих лиц можно очень детально и тщательно, поэтому никакие простые уловки типа затягивания галстука не помогут делу. Это моё дилетантское мнение, если что. К спецам не отношусь.

— tr18437s (20/06/2015 22:19)
Вопрос возможно ли технически существование голосовых банков данных, и если возможно – методы борьбы.
Есть в открытом доступе софт, который используется для проведения экспертизы?

— просто_Гость (20/06/2015 23:01, исправлен 20/06/2015 23:04)

> Вопрос возможно ли технически существование голосовых банков данных,

Вот вам набирающий силу проект Алло,google^[link11]

Читайте здесь и в сети про склемблеры^[link12]

— pgprubot (21/06/2015 20:05)

> Вопрос возможно ли технически существование голосовых банков данных

Если вы читали ссылки в этом треде, должны были видеть, что там об их существовании заявлется прямым образом.

> и если возможно – методы борьбы.

> Читайте здесь и в сети про склемблеры

И про вокодеры (см. выше). Обсуждалось в разных тредах и не один раз. Простых, доверяемых и надёжных решений нет. Самый надёжный способ — набирать текст на клавиатуре в реальном времени, а программа пусть его озвучивает.

> Есть в открытом доступе софт, который используется для проведения экспертизы?

По первой же ссылке из этого треда:

По данной теме очень мало материала в паблике, похоже, такой же алгоритм используется дачи анонимных свидетельский показаний в судах^[link13] и выглядит надежным для правдоподобного отрицания при голосовой идентификации.

tr18437s, следующие посты из разряда «тред не читай, сразу отвечай» будут игнорироваться.

— tr18437s (03/11/2015 12:37)
Что, если сначала применить распознавание речи, потом озвучить полученный текст. Будет общение с задержкой, но не критично.

— pgprubot (03/11/2015 13:07, исправлен 03/11/2015 13:07)

Ну да, распознали речь, перекодировали её в текст, текст передали, на выходе текст читает программа — может быть, когда-нибудь такое будет, но пока это ближе к фантастике.

Ссылки

^[link1] http://www.pgpru.com/comment65839

^[link2] http://www.pgpru.com/comment79192

^[link3] http://www.pgpru.com/comment66289

^[link4] http://www.pgpru.com/comment67146

^[link5] https://www.pgpru.com/comment72906

^[link6] http://williamandrewburnson.com/media/RealTimeVoiceConversion.pdf

^[link7] http://torfone.org

^[link8] http://www.youtube.com/watch?v=mJ6S4IV2pMk

^[link9] http://www.pgpru.com/comment62011

^[link10] http://top.rbc.ru/incidents/16/10/2003/63606.shtml

^[link11] https://yandex.ru/search/?text=google%20голосовой%20набор

^[link12] https://yandex.ru/search/?text=СЃРєСЂРµРјР±Р»РµСЂ

^[link13] http://www.srs.kiev.ua/images/stories/PDF_brochures/SRS%20Anonymity%20System%20RU.pdf

openPGP в России

изменение голоса при телефонных разговорах