изменение голоса при телефонных разговорах
На сколько эффективно против автоматического рапознавания в китайских телефонах с встроенной функцией? Есть под андройд, симбиан, блекберри?
Ссылки
[link1] http://www.pgpru.com/comment65839
[link2] http://www.pgpru.com/comment79192
[link3] http://www.pgpru.com/comment66289
[link4] http://www.pgpru.com/comment67146
[link5] https://www.pgpru.com/comment72906
[link6] http://williamandrewburnson.com/media/RealTimeVoiceConversion.pdf
[link7] http://torfone.org
[link8] http://www.youtube.com/watch?v=mJ6S4IV2pMk
[link9] http://www.pgpru.com/comment62011
[link10] http://top.rbc.ru/incidents/16/10/2003/63606.shtml
[link11] https://yandex.ru/search/?text=google%20голосовой%20набор
[link12] https://yandex.ru/search/?text=скремблер
[link13] http://www.srs.kiev.ua/images/stories/PDF_brochures/SRS%20Anonymity%20System%20RU.pdf
Вокодеры обсуждались отсюда[link1] и далее.
Не нашел в этой теме ни намека на решение. Кроме того хотелось бы нормальный ответ в духе практической безопасности:
1. Да, китайские трубы решают – список моделей.
2. Вот такой софт под эти ос 1, 2, 3...
3. Все это туфта и на рынке нет нормального решения :(
И ссылочки:
1. Каким образом можно идентифицировать по голосу.
2. Принципы используемые для изменения голоса.
/comment79192[link2] & /comment66289[link3]. Ищите в этих постах слово «вокодер». Как я понял, даже с софтом для ПК всё не очень просто, понятно и безопасно, а уж про софт на телефонах — тем более.
По ссылкам это есть. Есть даже пробный mp3[link4]-фaйл с записью изменённого голоса от gegel'я.
P.S. Я понимаю, что 29 страниц топика — это много, но ведь надо вам, а не мне. Почему я за вас должен их лопатить, выискивая конкретные цитаты?
Конретно по поводу встроенной голосоменялки в GSM-телефонах Donod C3+
была отдельная ветка, позже подзабытая. Там есть ссылка на мой пример работы вокодера на "голосе Евы": /comment72906[link5].
Кстати, позже я вник в работу William Andrew Burnson[link6] и адаптировал LPC-кодек от SpeakFreely для работы в качестве вокодера, меняя параметры-описатели после кодирования фрейма голоса и затем раскодируя. Получаются неплохие эффекты, но вопрос, на сколько это недоказуемо, открыт.
Дело в том, что для голосовой идентификации в forensic-софте используются статистические методы (например, Hidden Markov model). Т.о., при частичной смене описателей голоса все равно заданная вероятность ошибки нулевой гипотезы будет достижима при наличии определенного количества оригинального и тестируемого голоса, что может быть принято судом в качестве доказательства.
Поэтому стоит помнить, что возможность идентификации пропорциональна длительности разговора.
Почему бы в таком случае вокодеру автоматически не изменять параметры кодирования голоса через некоторые интервалы времени в процессе разговора?
Короче, ребята, всё – уныло. Хотелось бы конечно правдоподобного изменения голоса при разговоре по телефону. Но, увы, не так всё просто, хоть и 21 век на дворе.
Придется говорить через тяпочку. Или нос пальцами зажимать :)
Именно так и делается. Но изменить ВСЕ параметры невозможно – от голоса ничего не останется. Изменяются параметры частично в той степени, чтобы голос оставался по крайней мере разборчивым. И даже если эти параметры частично случайны, то все равно при статистическом анализе достаточно больших последовательностей можно с заданной вероятностью определить скрытые от наблюдателя индивидуальные факторы: размер глотки, языка, связок и т.п. Для этого и применяется Hidden Markov model.
Теоретически, наверное, можно поступать по другому: выявить связи между индивидуальными анатомическими факторами и описателями и затем менять описатели уже целенаправленно по созданному алгоритму, подгоняя их под виртуальные факторы иммитируемого голоса. Наверняка такие исследования проводились, но, конечно, в открытом доступе ни научных публикаций, ни тем более практических алгоритмов нет.
Как пример – веб-сервисы с возможностью трансформации вашего голосового ролика в голос известных артистов или политиков. Опять же, без подробного описания используемых алгоритмов о надежности транформации речь не идет.
Поэтому и непросто: технологии идентификации совсем другие А что в 22-м будет?
Например, до сих пор иногда военные пользуют старые ЗАС, переставляющие формантные зоны, и очень удивляются, когда их ломают.
это от бедности.
Да фик с ней, с идентификацией. Чтоб ее провести нужно еще примерно понять кто говорит, откуда, "принять" этого человека. Хотя б просто была б возможность изменить голосок на другой (реальный, человеческий), как можно сделать это в скайпе, к примеру. Я не идентификацию имел ввиду :)
Глянул на главную страницу сайта, а там...
Вообще, надо различать две задачи:
Т.е. такие веб-сервисы существуют?
Хинт: голосовой банк данных[link9]. Скоро все там будем, если не уже. Самые отпетые уже более 10-ти лет[link10] там.
Вообще интересно сделать невозможным автоматизированное сравнение голоса с имеющимися образцами. Необязательно программно. Может быть достаточно потуже затянуть галстук?:) Что скажут спецы?
Это задача типа той, когда о человеке неизвестно ничего, но его надо найти по голосу, сравнивая его с тысячами образцов. Мне кажется, в реальности обычно решается другая задача: о человеке помимо его голоса известно много что, это сужает круг поиска и даже, возможно, ограничивает его буквально несколькими лицами, а вот сравнить с голосами этих лиц можно очень детально и тщательно, поэтому никакие простые уловки типа затягивания галстука не помогут делу. Это моё дилетантское мнение, если что. К спецам не отношусь.
Вопрос возможно ли технически существование голосовых банков данных, и если возможно – методы борьбы.
Есть в открытом доступе софт, который используется для проведения экспертизы?
Вот вам набирающий силу проект Алло,google[link11]
Читайте здесь и в сети про склемблеры[link12]
Если вы читали ссылки в этом треде, должны были видеть, что там об их существовании заявлется прямым образом.
И про вокодеры (см. выше). Обсуждалось в разных тредах и не один раз. Простых, доверяемых и надёжных решений нет. Самый надёжный способ — набирать текст на клавиатуре в реальном времени, а программа пусть его озвучивает.
По первой же ссылке из этого треда:
tr18437s, следующие посты из разряда «тред не читай, сразу отвечай» будут игнорироваться.
Что, если сначала применить распознавание речи, потом озвучить полученный текст. Будет общение с задержкой, но не критично.
Ну да, распознали речь, перекодировали её в текст, текст передали, на выходе текст читает программа — может быть, когда-нибудь такое будет, но пока это ближе к фантастике.