Audio\Videogrep.py
Audiogrep[link1] — интересный питоновский скрипт, который осуществляет распознавание речи из аудиофайлов, а потом ищет текст по заданному запросу, извлекает каждый найденный фрагмент и склеивает их все в общий звуковой файл.
Получается эдакая мега-подборка на заданную тему. Сам автор говорит[link2], что использует её для обработки аудиокниг.
Скрипт использует программу CMU Pocketsphinx[link3] для распознавания речи, а также pydub[link4] для склеивания звуковых кусочков.
Опять же, автор упоминает другой скрипт videogrep[link5], который вышел раньше. Он делает совершенно то же самое, только с видеороликами. Анализ происходит по звуковой дорожке, но вместе с ней можно брать и сопровождающее видео.
[link2] http://lav.io/2015/02/audiogrep-automatic-audio-supercuts/
[link3] http://cmusphinx.sourceforge.net/
[link4] http://pydub.com/
[link5] http://github.com/antiboredom/videogrep