IBM разрабатывает систему, которая способна проводить полнотекстовый поиск в архиве видеоматериалов. Новая поисковая система под кодовым названием Marvel может индексировать все видеоматериалы в интернете, не используя при этом текстовые аннотации, а распознавая само содержание этих материалов.

Д
я современного интернета это действительно серьезная проблема, потому что обычные поисковые сайты проводят поиск среди мультимедиа-файлов только на основе сопроводительной текстовой аннотации. Ни одна программа на сегодняшний день не способна распознать образы на видеороликах.

Ручная же классификация требует слишком много усилий. Информации слишком много. По последним исследованиям (http://www.sims.berkeley.edu/research/projects/how-much-info-2003/execsum.htm), все телевизионные станции в мире ежегодно производят около 123 млн часов видеопродукции. А ведь есть еще домашнее видео, а также видео с камер наблюдения и других устройств. Без автоматического индексирования тут не обойтись.

Система Marvel (http://mp7.watson.ibm.com/marvel/), разработанная в IBM, способна автоматически распознавать более 100 образов на видеокадрах: самолет, животное, здание, дорога, пейзаж, спорт и т.д. В ближайшее время исследовательская группа Marvel обещает довести число распознаваемых объектов до 1000 (так, например, из категории “спорт” планируется вычленить “теннис”, “баскетбол” и т.д.). Для индексирования видеоархива анализируются не только видеокадры, но и сопровождающий звук. Это помогает с большой точностью распознать, например, запуск ракеты.

Прототип системы Marvel, основанной на MPEG-7, был впервые продемонстрирован в действии в августе 2004 г. на конференции в Кембридже, где система успешно проиндексировала более 200 ч видеосюжетов и очень впечатлила телевизионщиков, которым подобная программа как воздух нужна для работы. Вот лишь некоторые примеры (http://mp7.watson.ibm.com/cgi-marvel-bin/WebCBR03.exe?L=1396&COLS=2&TD=0&U=0&ND=1&LS=5&COMB=1&AGGR=3&OP=9) успешного распознавания образов системой Marvel.

Полнофункциональная версия Marvel может появиться на рынке в лучшем случае через три-пять лет.

By Ruslan Novikov

Интернет-предприниматель. Фулстек разработчик. Маркетолог. Наставник.