Искусственный интеллект, или как устроена стандартная видеоаналитика?
Дата публикации: 05.08.2011

Трепанация компьютерного мозга.

К сожалению, под всеми этими громкими фразами производители систем видеонаблюдения понимают довольно банальные и мало кому полезные возможности, качество которых, к тому же, ограничено естественными помехами. Так про что же всё время говорят «видеоаналитика и искусственный интеллект»?

Во-первых, природа всему – видеодетектор объектов (object detector), способный идентифицировать, хоть и с сомнительной точностью, движущиеся объекты. Естественно, у него нет никакого реального машинного интеллекта: качание ветки дерева будет определяться так же, как и движение человека. OD локализует отдельные геометрические фигуры детекции как некие самостоятельные объекты с собственным ID. Это лишь работа с геометрией, редко с тригонометрией, никаких других возможностей в этом «интеллекте» нет.

Естественно, машина легко может проанализировать соотношение сторон, сделав полуложный вывод, что вертикальный прямоугольник – это человек, а горизонтальный – автомобиль. Но в жизни два-три человека могут идти вместе, тогда геометрия их детекции будет больше похожа на автомобиль. А высокий фургон наоборот будет иметь форму человека. К сожалению, у двухмерной камеры нет перспективы, она чаще всего не может понять размеры объекта, поэтому выводы делаются лишь по крайне спорной форме объекта. Невозможность определения размеров делает все интеллектуальные примочки еще примитивнее.

detec1.jpg

Найдите несколько отличий в геометрии детекции! И какой объект больше в размерах?



Теоретически и на плоскости можно построить псевдоперспективу, но опять же, все эти шаманства хорошо смотрятся лишь на презентациях, в жизни - лишь бесполезные игрушки для взрослых.

handicap_1.jpg

Кто больше или что?



Ну вот, с интеллектом разобрались. Более подробно этот вопрос мы освещали раньше в статье о том, как камеры ведут цель. Теперь поговорим, как же на нем строится стандартная видеоаналитика. Итак, разработчикам показалось, что они могут идентифицировать движущиеся объекты перед камерой и даже где-то распознавать их по принадлежности. Ну, что ж, эта теория дает возможность определять направление движения каждого из объектов. Вот, вобщем-то и всё!

direction3.jpg isk_intel14.jpg

Ну, некоторые пытаются пропиарить определение скорости. Проходит, но с душком. Все же на двухмерной камере непонятно, что быстрее движется: самолет вдалеке или палец руки перед камерой.

А вот дальше идут, собственно говоря, сами аналитические умозаключения. Если, например, направление движения объекта ведет к вашему офису, то можно подать сигнал тревоги. Или можно вычислять пересечение виртуальных линий, нарисованных на видеоизображении.

isk_intel15.jpg

Картинка взята с сайта



Таким образом, мы получаем систему контроля периметра. Ну, не круто! Без всяких там датчиков и сигнализаций можно охранять огромные пространства, просматриваемые видеокамерами.

nastroika_zon.jpg

Тут можно сделать только одно негативное замечание: если на вашей охраняемой в лесу базе вдруг появится стайка птичек и начнет туда-сюда летать, замучаетесь вызывать группу быстрого реагирования. Еще хуже, если в вашей местности водятся мошки. Редкость, конечно, для России, но вдруг? Тогда их блики перед прожекторами будут создавать такую видеоаналитическую картинку, что вы сообщите о нападении роты диверсантов. Ну, а растительность в лесу вообще надо исключить, иначе ветер начнет гнуть ветки. Еще необходимо запретить дождик, зимой – обязательно снег, перед камерами в свете прожектора он принимает немыслимые формы.

Естественно, что в GOALcity все эти примочки есть, иначе как выжить на рынке? Более того, работают они, не в пример другим, по самым выверенным алгоритмам, в чем можно убедиться в любую секунду, нажав на эту ссылку. Круглосуточная трансляция реальности - а не смонтированные в идеальных условиях видеоролики – залог уверенности, что вас не обманывают (ну, относительно надежный залог). Для тех, кому лень ждать в эфире появления целей, мы выкладываем видеозапись экрана монитора, созданную при помощи «Амальгамы». Её специально сделали одним длинным бесперебойным куском, чтобы исключить вопросы видеомонтажа. Как правило «монтажники» на длинные куски не заморачиваются, выхватывают только краткие хорошо получившиеся фрагменты.

Видеофайл :: Прессцентр НИИ СпецЛаб :: Посмотреть видео 9:00

Вы можете видеть в реальности, как работает стандартная видеоаналитика в жизни. И даже заметите, что совсем не так уж плохо, как мы описывали выше. Действительно, применять такую технологию можно, но только для чего? Если вы хотите, чтобы система безопасности звонила вам на телефон каждый раз, когда пересекается линия периметральной охраны, то несколько ложных звонков вас выведут из себя. Если вы хотите, чтобы оператор реагировал на то же самое, то периодически появляющиеся стайки птичек или мошек перед камерами, а также множество других помех в одну прекрасную минуту вынудят его выключить звук. Даже специально выделенный человек не будет обращать внимание на предупреждения, если их число превышает определенный порог. Просто тревог будет больше, чем спокойствия. Охранник начнет реагировать не на тревоги, а на их отсутствие.

По сути стандартную видеоаналитику можно применять в каких-то узкоспециализированных целях, например, при контроле правил дорожного движения. Там вместо постоянного поиска происшествия человеку можно дать упрощающий процесс инструмент. Вот это полезная тема! В науке при исследовании молекулярных частиц также можно производить всеразличные анализы.

handicap_copy.jpg

Вместо огромного потока видео можно получать только те кадры, в которых предположительно есть нарушение правил дорожного движения.



В системе GOALcity этот тип «интеллектуальной» детекции тоже используется, но для построения более эффективных схем видеоанализа, нежели стандартная видеоаналитика. Спецлаб использует её лишь как вспомогательную функцию в своей, если так можно выразиться, более продвинутой видеоаналитике. Сами разработчики называют ее гибкой видеоаналитикой, определяя стандартную как жесткая.

Спецлабовская система видеоанализа довольно сильно отличается от распространенной по всему миру стандартной жесткой видеоаналитики. Причем, кардинально. И не какой-то сложной технологией. Распространено мнение, что системы Спецлаб слишком сложные. Но оно зиждется на существующих знаниях: то, что всем известно, кажется простым, а все новое неизученное – даже если это в сотни раз упрощает изученное – кажется сложным.

В системе GOALcity вместо оповещения по жестко заданным алгоритмам поведения (которые никогда не бывают точными), используется сокращение информационного потока, поступающего к человеку для контроля. Причем, уровень так называемого аналитического сжатия превышает сотни тысяч раз. Эта система видеоконтроля живет в гармонии с хозяином, она дает ему только столько информации, сколько он может усвоить, доводя «самое-самое».

В пику понятным, но сложным в настройке алгоритмам стандартной жесткой видеоаналитики, спецлабовская система не требует настройки вообще. Основанная на видеостатистике, она сама изучает обстановку перед камерами, выделяя алогичные моменты поведения. Она легко отстраивается от помех, так как помехи также являются частью статистики, что приводит к вычитанию их самих из себя. Получается гармония не только с человеком, но и с природой.

Правильнее назвать такую видеоаналитику видеосемантикой. Надо отметить, в отличие от недавно испеченного «машинного интеллекта» семантические науки существуют уже несколько веков. И, кстати, им великие ученые предвещали первые ростки искусственного разума. Впервые в мире это учение привязано к видеоконтролю в НИИ Спецлаб. Если вы наберете в поиске слова «видеосемантика», то пока больше ни у кого его нет. Но через несколько лет, мы уверены, оно будет самым популярным в системах безопасности. Как и многое другое, разработанное в Спецлаб, стало таким.

Продолжение следует в статье «Видеосемантика – практическая видеоаналитика».

В какую сторону побегут люди, если закричать «пожар»?

Как спасти больше людей в сценарии с башнями-близнецами 11 сентября?

Перехват целей видеокамерами.
Копаемся в интеллекте.