изменение голоса при телефонных разговорах


На сколько эффективно против автоматического рапознавания в китайских телефонах с встроенной функцией? Есть под андройд, симбиан, блекберри?

Комментарии
— SATtva (28/05/2014 16:28)   
Вокодеры обсуждались отсюда[link1] и далее.
Гость (29/05/2014 00:52)   
Не нашел в этой теме ни намека на решение. Кроме того хотелось бы нормальный ответ в духе практической безопасности:
1. Да, китайские трубы решают – список моделей.
2. Вот такой софт под эти ос 1, 2, 3...
3. Все это туфта и на рынке нет нормального решения :(
И ссылочки:
1. Каким образом можно идентифицировать по голосу.
2. Принципы используемые для изменения голоса.
Гость (29/05/2014 02:57)   
/comment79192[link2] & /comment66289[link3]. Ищите в этих постах слово «вокодер». Как я понял, даже с софтом для ПК всё не очень просто, понятно и безопасно, а уж про софт на телефонах — тем более.


По ссылкам это есть. Есть даже пробный mp3[link4]-фaйл с записью изменённого голоса от gegel'я.

P.S. Я понимаю, что 29 страниц топика — это много, но ведь надо вам, а не мне. Почему я за вас должен их лопатить, выискивая конкретные цитаты?
— gegel (04/06/2014 19:52)   
Конретно по поводу встроенной голосоменялки в GSM-телефонах Donod C3+
была отдельная ветка, позже подзабытая. Там есть ссылка на мой пример работы вокодера на "голосе Евы": /comment72906[link5].
Кстати, позже я вник в работу William Andrew Burnson[link6] и адаптировал LPC-кодек от SpeakFreely для работы в качестве вокодера, меняя параметры-описатели после кодирования фрейма голоса и затем раскодируя. Получаются неплохие эффекты, но вопрос, на сколько это недоказуемо, открыт.
Дело в том, что для голосовой идентификации в forensic-софте используются статистические методы (например, Hidden Markov model). Т.о., при частичной смене описателей голоса все равно заданная вероятность ошибки нулевой гипотезы будет достижима при наличии определенного количества оригинального и тестируемого голоса, что может быть принято судом в качестве доказательства.
Поэтому стоит помнить, что возможность идентификации пропорциональна длительности разговора.
— SATtva (04/06/2014 20:17)   
Почему бы в таком случае вокодеру автоматически не изменять параметры кодирования голоса через некоторые интервалы времени в процессе разговора?
Гость (04/06/2014 20:41)   
Короче, ребята, всё – уныло. Хотелось бы конечно правдоподобного изменения голоса при разговоре по телефону. Но, увы, не так всё просто, хоть и 21 век на дворе.
Гость (04/06/2014 20:43)   
Придется говорить через тяпочку. Или нос пальцами зажимать :)
— gegel (04/06/2014 21:39, исправлен 04/06/2014 21:48)   
Почему бы в таком случае вокодеру автоматически не изменять параметры кодирования голоса через некоторые интервалы времени в процессе разговора?

Именно так и делается. Но изменить ВСЕ параметры невозможно – от голоса ничего не останется. Изменяются параметры частично в той степени, чтобы голос оставался по крайней мере разборчивым. И даже если эти параметры частично случайны, то все равно при статистическом анализе достаточно больших последовательностей можно с заданной вероятностью определить скрытые от наблюдателя индивидуальные факторы: размер глотки, языка, связок и т.п. Для этого и применяется Hidden Markov model.
Теоретически, наверное, можно поступать по другому: выявить связи между индивидуальными анатомическими факторами и описателями и затем менять описатели уже целенаправленно по созданному алгоритму, подгоняя их под виртуальные факторы иммитируемого голоса. Наверняка такие исследования проводились, но, конечно, в открытом доступе ни научных публикаций, ни тем более практических алгоритмов нет.
Как пример – веб-сервисы с возможностью трансформации вашего голосового ролика в голос известных артистов или политиков. Опять же, без подробного описания используемых алгоритмов о надежности транформации речь не идет.


Но, увы, не так всё просто, хоть и 21 век на дворе.

Поэтому и непросто: технологии идентификации совсем другие А что в 22-м будет?
Например, до сих пор иногда военные пользуют старые ЗАС, переставляющие формантные зоны, и очень удивляются, когда их ломают.

Гость (04/06/2014 23:39)   

это от бедности.
Гость (05/06/2014 18:10)   


Да фик с ней, с идентификацией. Чтоб ее провести нужно еще примерно понять кто говорит, откуда, "принять" этого человека. Хотя б просто была б возможность изменить голосок на другой (реальный, человеческий), как можно сделать это в скайпе, к примеру. Я не идентификацию имел ввиду :)
Гость (10/06/2014 00:25)   

Глянул на главную страницу сайта, а там...

Real-Time Voice Conversion: A Multirate 8kHz LPC Vocoder, Project Paper, 2011


Вообще, надо различать две задачи:
  1. Хочу, чтоб меня не узнали на слух люди, которые меня знают.
  2. Хочу, чтобы экспериза не смогла доказать, что это говорил я, даже при том, что у экспертизы есть множество неизменённых записей моего голоса.


Т.е. такие веб-сервисы существуют?


Хинт: голосовой банк данных[link9]. Скоро все там будем, если не уже. Самые отпетые уже более 10-ти лет[link10] там.
— tr18437s (20/06/2015 00:53)   
Вообще интересно сделать невозможным автоматизированное сравнение голоса с имеющимися образцами. Необязательно программно. Может быть достаточно потуже затянуть галстук?:) Что скажут спецы?
— pgprubot (20/06/2015 10:56)   

Это задача типа той, когда о человеке неизвестно ничего, но его надо найти по голосу, сравнивая его с тысячами образцов. Мне кажется, в реальности обычно решается другая задача: о человеке помимо его голоса известно много что, это сужает круг поиска и даже, возможно, ограничивает его буквально несколькими лицами, а вот сравнить с голосами этих лиц можно очень детально и тщательно, поэтому никакие простые уловки типа затягивания галстука не помогут делу. Это моё дилетантское мнение, если что. К спецам не отношусь.
— tr18437s (20/06/2015 22:19)   
Вопрос возможно ли технически существование голосовых банков данных, и если возможно – методы борьбы.
Есть в открытом доступе софт, который используется для проведения экспертизы?
— просто_Гость (20/06/2015 23:01, исправлен 20/06/2015 23:04)   

Вот вам набирающий силу проект Алло,google[link11]


Читайте здесь и в сети про склемблеры[link12]

— pgprubot (21/06/2015 20:05)   

Если вы читали ссылки в этом треде, должны были видеть, что там об их существовании заявлется прямым образом.


И про вокодеры (см. выше). Обсуждалось в разных тредах и не один раз. Простых, доверяемых и надёжных решений нет. Самый надёжный способ — набирать текст на клавиатуре в реальном времени, а программа пусть его озвучивает.


По первой же ссылке из этого треда:

По данной теме очень мало материала в паблике, похоже, такой же алгоритм используется дачи анонимных свидетельский показаний в судах[link13] и выглядит надежным для правдоподобного отрицания при голосовой идентификации.

tr18437s, следующие посты из разряда «тред не читай, сразу отвечай» будут игнорироваться.
— tr18437s (03/11/2015 12:37)   
Что, если сначала применить распознавание речи, потом озвучить полученный текст. Будет общение с задержкой, но не критично.
— pgprubot (03/11/2015 13:07, исправлен 03/11/2015 13:07)   

Ну да, распознали речь, перекодировали её в текст, текст передали, на выходе текст читает программа — может быть, когда-нибудь такое будет, но пока это ближе к фантастике.


Ссылки
[link1] http://www.pgpru.com/comment65839

[link2] http://www.pgpru.com/comment79192

[link3] http://www.pgpru.com/comment66289

[link4] http://www.pgpru.com/comment67146

[link5] https://www.pgpru.com/comment72906

[link6] http://williamandrewburnson.com/media/RealTimeVoiceConversion.pdf

[link7] http://torfone.org

[link8] http://www.youtube.com/watch?v=mJ6S4IV2pMk

[link9] http://www.pgpru.com/comment62011

[link10] http://top.rbc.ru/incidents/16/10/2003/63606.shtml

[link11] https://yandex.ru/search/?text=google%20голосовой%20набор

[link12] https://yandex.ru/search/?text=скремблер

[link13] http://www.srs.kiev.ua/images/stories/PDF_brochures/SRS%20Anonymity%20System%20RU.pdf