

Самые читаемые новости
- Теперь мы можем наводиться на ракеты
- Бесперебойный видеоблейзер
- Вы просто поворачиваете руку и видите, что произошло на объекте
- А ведь звук распространяется не только в помещении
- Еще один физический источник полезной информации
- CCTV-камеры еще не раз запотеют на похоронах IP-телевидения
- Говорим все вместе!
- Видеоплан
- Человеческий фактор больше не зависит от одного человека
- Общение без перемещения
Голос в толпе
Voice cleaner. Услышать всех и каждого в отдельности – позволяет новая технология от СпецЛаб
Создав огромное число технологий по видеообработке, программисты НИИ СпецЛаб переключились на звук. Благо, новый чип оцифровки, применяемый на платах GOAL v9, позволяет творить чудеса.
Существует множество алгоритмов очистки голоса от шумов, но пока еще никто (по информации из известных открытых источников) не научился выделять один голос из совместного разговора других. Когда говорят несколько человек, в записи, как правило, мы можем услышать только наиболее громкий голос. А если говорят на одинаковом уровне, то вообще ничей. Выделить в толпе голос конкретного человека – до сих пор было нерешенной задачей. Пришло время подтянуть технологии безопасности до современного уровня.
Собственно говоря, это обычная математика. При установке нескольких микрофонов в разных концах помещения, по разностной составляющей можно точно вычистить голос отдельного человека, даже если много людей говорят все вместе. Три прикладных математических принципа позволяют не только убирать шумы, вырезая одинаковые составляющие на всех микрофонах, но и производить избирательную настройку на конкретный источник звука в зависимости от его расположения по отношению к записывающим микрофонам.
Уже два микрофона, установленных в противоположных углах, позволяют выделить одного человека из трех одновременно говорящих в комнате 10х12 м. Каждый следующий микрофон увеличивает возможности в 4 раза. (Такие показатели получены в лабораторных условиях.) Теоретически несколько десятков микрофонов, установленных на вокзале, могут записывать речь с прослушиванием в избирательном режиме – «понять каждого!»

Для настройки на интересуемый источник звука требуется указать координату относительно установленных микрофонов, что требует установки двух камер. Более долгим путем можно производить обычный перебор частотных составляющих в каждом алгоритме. Но уже испытан и автоматический поиск интересуемого голоса при условии, что существует образец его речи.
В дальнейшем планируется использование и других вариантов. Главное – положено начало новой полезной функции. О ее практическом применении можно будет сказать только после испытаний на конкретных объектах.


