Audio\Videogrep.py


Audiogrep[link1] — интересный питоновский скрипт, который осуществляет распознавание речи из аудиофайлов, а потом ищет текст по заданному запросу, извлекает каждый найденный фрагмент и склеивает их все в общий звуковой файл.

Получается эдакая мега-подборка на заданную тему. Сам автор говорит[link2], что использует её для обработки аудиокниг.

Скрипт использует программу CMU Pocketsphinx[link3] для распознавания речи, а также pydub[link4] для склеивания звуковых кусочков.

Опять же, автор упоминает другой скрипт videogrep[link5], который вышел раньше. Он делает совершенно то же самое, только с видеороликами. Анализ происходит по звуковой дорожке, но вместе с ней можно брать и сопровождающее видео.


Ссылки
[link1] http://antiboredom.github.io/audiogrep/

[link2] http://lav.io/2015/02/audiogrep-automatic-audio-supercuts/

[link3] http://cmusphinx.sourceforge.net/

[link4] http://pydub.com/

[link5] http://github.com/antiboredom/videogrep