Функции распознавания речи открывают новые возможности при поиске видео
Блог Ирен Сэндлер (Irene Sandler), старшего менеджера компании Cisco по продвижению перспективных видеотехнологий
Каждый месяц на одном только сайте YouTube люди просматривают более 3 миллиардов часов видео, причем роликами развлекательного содержания дело не ограничивается. Так, при помощи видеоресурсов я научилась менять водопроводный кран, почерпнула немало любопытных фактов из конференций TED и посмотрела запись совещания, посвященного запуску новых продуктов нашей компании.
Это, однако, потребовало поиска нужных видеороликов, что для большинства из нас означает кропотливый отбор нужных ресурсов. В лучшем случае мы сортируем видеоролики по заданным вручную тегам, а затем двигаем курсор взад-вперед, пока не найдем интересующую информацию. Словом, поиск отнимает уйму времени.
Существенных временных затрат требует и такое занятие, как просмотр политических дебатов. За последние месяцы кандидаты в президенты Соединенных Штатов от Республиканской партии встречались лицом к лицу более 20 раз, обсуждая широкий спектр вопросов. Только представьте, сколько времени и усилий понадобилось бы, чтобы найти все видеофайлы, в которых бывший губернатор штата Массачусетс Митт Ромни рассуждает об иммиграции, или проанализировать дискуссии кандидатов, чтобы узнать, кто из них что сказал о верховном суде, конституции или автопромышленности.
Специально разработанное для анализа видеоконтента решение Cisco Pulse позволило нам применить функцию распознавания речи для анализа четырех таких дебатов, состоявшихся в период с 19 января по 22 февраля. В них приняли участие уже упомянутый Митт Ромни, бывший сенатор от штата Пенсильвания Рик Санторум, бывший спикер палаты представителей США Ньют Гингрич и член палаты представителей от штата Техас Рон Пол. (Занимательный разбор того, что было сказано и что попало в СМИ, можно прочитать в блоге компании Action Nugget, специализирующейся на глубинном маркетинговом анализе.)
Решение Cisco Pulse – это не просто технология преобразования речи в текст. Благодаря созданному компанией Cisco модулю распознавания речи, технология Pulse сортирует всю видеоинформацию по ключевым словам и авторам, позволяя сразу перейти к интересующему фрагменту видеоролика либо просмотреть всю библиотеку файлов, отобранных по содержанию или по имени автора, а не по указанным вручную тегам. Cisco Pulse мгновенно отображает основные ключевые слова для каждого ролика, т.е. кто и что сказал в том или ином контексте. На инфографике ниже приведена сводная информация по темам всех дебатов и высказываниям выступающих как пример результатов поиска с помощью Cisco Pulse. (Щелкните для просмотра увеличенного интерактивного изображения).
Добавим, что Cisco Pulse – бизнес-инструмент, задача которого – помочь клиентам управлять видеоконтентом, извлекая из него максимальную пользу. Так, студенты смогут найти пропущенную ими информацию в архивах записей лекций, а сотрудники компаний – необходимые сведения в базе записей совещаний. Решение Cisco Pulse не просто ускоряет поиск необходимого видеоконтента, но и позволяет извлечь необходимые данные из гигабайтов видеоинформации, создавая удобную картотеку небольших видеофайлов.
О компании Cisco
Cisco – мировой лидер в области сетевых технологий, меняющих способы человеческого общения, связи и совместной работы. Чистый объем продаж компании в 2011 финансовом году составил 43,2 млрд долларов.
Cisco, логотип Cisco, Cisco Systems и логотип Cisco Systems являются зарегистрированными торговыми знаками Cisco Systems, Inc. в США и некоторых других странах. Все прочие торговые знаки, упомянутые в настоящем документе, являются собственностью соответствующих владельцев.