Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерное моделирование процессов и систем / Ухо_Глаз / Ухо / Идентификация_голоса / ArPhone 2 архиватор телефонных переговоров, IMS (Харьков, Украина)

.htm
Скачиваний:
24
Добавлен:
26.03.2015
Размер:
21.37 Кб
Скачать

ArPhone 2: архиватор телефонных переговоров, IMS (Харьков, Украина) .menu0001 { Z-INDEX: 3; LEFT: 63px; POSITION: absolute } .menu0002 { Z-INDEX: 3; RIGHT: 65px; POSITION: absolute } .menu0010 { Z-INDEX: 3; RIGHT: 65px; POSITION: absolute } .menu0003 { Z-INDEX: 3; LEFT: 545px; POSITION: absolute } .menu1006 { Z-INDEX: 3; LEFT: 25px; POSITION: absolute } .menu1000 { Z-INDEX: 3; LEFT: 325px; POSITION: absolute } FONT.a200 { FONT-SIZE: 13pt } FONT.a300 { FONT-SIZE: 12pt } A:link { COLOR: #ffffcc; TEXT-DECORATION: none } A:visited { COLOR: #ffffaa; TEXT-DECORATION: none } A:active { COLOR: #ffff99; TEXT-DECORATION: none } A:hover { COLOR: red; TEXT-DECORATION: underline } A.one10:link { COLOR: #000099; TEXT-DECORATION: underline } A.one10:visited { COLOR: #000077; TEXT-DECORATION: underline } A.one10:active { COLOR: #aa0000; TEXT-DECORATION: underline } A.one10:hover { COLOR: red; TEXT-DECORATION: underline } BODY { SCROLLBAR-FACE-COLOR: #044474; SCROLLBAR-ARROW-COLOR: #ffffff; SCROLLBAR-TRACK-COLOR: #7f929f }

ArPhone 2 Инструкция Техподдержка Контакты Публикации Add Favorite Статьи, публикации и разъяснения

Система документирования речи «ArPhone 2»   Кто говорит? Проблемы идентификации голоса У меня зазвонил телефон.

— Кто говорит? — Слон.

— Откуда? — От верблюда!

   К. Чуковский    Для криминалиста в этом детском стишке есть несколько задач — идентификация личности (действительно ли говорит некто по имени (кличке) «Слон»), определение номера телефона, с которого был сделан звонок, имя владельца телефона («Верблюд») и его адреса. Если бы этот разговор документировался регистратором телефонных переговоров, например, ArPhone-2x, снабженным автоматическим определителем номера (АОН), то последние задачи решаются довольно просто. Дежурный оператор, получив номер телефона звонившего абонента, практически, немедленно получил бы и его адрес, наличие у владельца телефона зарегистрированного оружия, автотранспорта, судимости и т.п. Система документирования речи ArPhone-2x компании «Интел-Медиа Сервис» предусматривает интеграцию программного обеспечения рабочего места дежурного оператора с соответствующими базами данных.    Гораздо сложнее дело обстоит с первой задачей — проблемой идентификации личности по голосу. Увы, в повседневной практике украинских служб обеспечения безопасности пока невозможно в режиме реального времени организовать поиск голоса абонента по архиву системы документирования или по централизованной базе данных — «отпечатков» голосов. Однако, есть основания считать, что в скором времени голосовая идентификация станет привычной процедурой, такой же, как дактилоскопическая экспертиза.    Интенсивное развитие вычислительных мощностей и совершенствование аппаратных средств обработки речи позволяет надеяться, что в недалеком будущем распознавание речи и автоматическая идентификация личности по голосу станут рутинной процедурой. Тем более, что интерес к этой области речевых технологий огромный. Как один из биометрических показателей голос используется для проверки прав доступа к каналам связи, базам данных, банковским счетам, камерам хранения, помещениям и, наконец, к обычным персональным компьютерам. Парольная защита не является достаточно надежной. Кроме того, попытки повышения надежности противодействия несанкционированному доступу за счет комбинации различных технических решений часто обходится недешево. Пароль можно угадать, подсмотреть, украсть, подобрать или передать. Ключи, какой сложности бы они ни были, можно подделать, украсть или просто потерять. Голос же является универсальным ключом, который нельзя украсть, кому-то передать, подделать или сломать.

 

   Большинство существующих систем идентификации личности по голосу построены на основе однократной проверки соответствия ключевой фразы (слова) с эталонной записью, хранящейся в памяти контрольного устройства. В режиме обучения системы пользователь несколько раз произносит короткую фразу (слово), которые используются для создания эталона-пароля. Наиболее часто эталоном служит вся ключевая фраза (слово), за исключением пауз. Полученный речевой сигнал может также сжиматься при помощи алгоритмов, не искажающих индивидуальные параметры голоса. Возможно использование не всей фразы (слова), а, так называемых, опорных сегментов — наиболее информативных участках речевого сигнала. Выбираются наиболее энергетически мощные звуки — гласные и звонкие согласные. В этих вокализованных участках речи хорошо проявляются анатомические особенности речевого тракта диктора.    Индивидуальные особенности голоса любого человека достаточно стабильны и в параметризованном виде могут быть использованы в течение длительного времени. Набор параметров голоса конкретного человека, хранящийся в системе контроля доступа, дает возможность точной идентификации личности. Например, если записать на телефонную магнитную карту такой «голосовой портрет», то этой картой не сможет воспользоваться никто другой.    Современные системы верификации голоса позволяют идентифицировать попытки ввода голосовых ключей с магнитных записей. Микрофоны и записывающие устройства имеют свои индивидуальные особенности, которые могут определяться программами верификации голоса. Можно заставить человека произнести пароль под угрозой насилия, но совершенная система верификации не должна предоставить право доступа к охраняемому объекту, распознав эмоциональные изменения в голосовом спектре.    Специалистам известно, что такие психологические состояния человека, как страх, тревога, вина, конфликтная озабоченность неизбежно вызывают изменения процессов мозговой деятельности. Помимо воли человека, автоматически в процесс саморегуляции включается вегетативная нервная система, регулирующая, в частности, содержание адреналина в крови, кожно-гальванические реакции, пото- и тепловыделение и тембр голоса (частоты основного тона голоса). Эти реакции (за исключением голосовых) традиционно используются в полиграфах — детекторах лжи. Если раньше такими устройствами обладали только спецслужбы, то в последнее время появились, если можно так назвать, «детекторы лжи широкого потребления» — трастеры — голосовые детекторы лжи. Это малогабаритные, умещающиеся на ладони, устройства можно носить в кармане или подключать к телефону. Например, портативный «Handy Truster» южнокорейской компании 911Computer Co (размеры 52х83х17, вес 45г (с батареей) дает возможность определять девять уровней «правдивости» и девять уровней стресса. Достоверность заключений, по утверждению фирмы — 76-82%, а сходимость с результатами на полиграфе — 100%. Подобные устройства выпускают еще несколько фирм, в том числе и вмонтированные в телефон. Результаты тестирования трастером не могут служить серьезным доказательством, например, при судебных разбирательствах. Трастер можно рассматривать как игрушку, создатели которой, тем не менее, использовали серьезные разработки и достижения речевых технологий.    Задача идентификации личности по голосу тесно связана с успехами науки в области иных речевых технологий, в том числе технологии распознавания речи. Существенным фактором сдерживания применения технологий распознавания речи и идентификации по голосу была невозможность автоматической сегментации речевого сигнала — адекватного разделение их на единицы, соотносимые с элементами алфавита. Некоторые ученые и сейчас уверены в том, нельзя провести корректную автоматическую сегментацию речи. Тем не менее, в настоящее время разработаны алгоритмы автоматической сегментации речи. И хотя проблем, похоже, меньше не стало, результаты впечатляют. Так, например, интеллектуальный телефонный коммутатор канадской компании «Mitel» принимает звонки и отключает абонентов, чьи голоса занесены в «черный список». Эта система спроектирована специально для радиостанций, принимающих звонки радиослушателей в прямом эфире, что иногда приводит к неприятным ситуациям. Встроенная в коммутатор программа идентифицирует голоса «провинившихся» радиослушателей, которых ни в коем случае нельзя пускать в эфир. Голосовая система гораздо эффективнее систем аналогичного назначения, фильтрующих входящие звонки по номеру телефона.    Есть еще более впечатляющие примеры. Так, в Интернет имеются сведения о системе распознавания речи «Оазис» («Oasis»), используемой ЦРУ для поиска террористов. Система способна проводить лексическую и голосовую идентификацию личности по радио или телевизионной трансляции и телефонным переговорам. Сообщается, что система имеет механизм машинного перевода и позволяет проанализировать получасовую трансляцию в течение 10-90 минут.    Анализ тенденций развития речевых технологий дает основания полагать, что системы распознавания речи и идентификации довольно быстро могут пройти стадию автоматизированных программно-аппаратных комплексов и перейти на уровень микроустройств — чипов, встраиваемых в различные речевые терминалы: телефоны, персональные компьютеры, банкоматы, системы документирования и системы безопасности. Вполне возможно, что средства речевого управления, системы диктовки, средства идентификации по голосу, синтезаторы речи станут такими же обычными атрибутами деловой жизни, как факс и компьютер. Владимир Шмалько

генеральный директор фирмы «ИНТЕЛ-МЕДИА СЕРВИС», к.т.н. Украина, Харьков, ул. Тринклера, 6, к. 41

Тел. +38 (057) 714-23-16, моб. 8 (067) 954-91-61

Веб-сайт: http://www.arphone.com.ua/index.htm, e-mail: ims@ic.kharkov.ua