Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Научные стремления 2012-1

.pdf
Скачиваний:
43
Добавлен:
21.02.2016
Размер:
9.94 Mб
Скачать

организация взаимодействия и координация деятельности государственных органов и иных организаций в области проведения государственной политики и обеспечения безопасности Республики Беларусь;

обеспечение информационной безопасности своей деятельности; упреждающее вскрытие любых проявлений подготовки нападения на

Республику Беларусь; защита независимости и территориальной целостности Республики

Беларусь, обеспечение национальной безопасности Республики Беларусь в политической, экономической, военно-стратегической, научно-технической, информационной, гуманитарной и экологической сферах;

борьба в пределах своей компетенции с террористической и иной экстремистской деятельностью, организованной преступностью и коррупцией, контрабандой, незаконной миграцией, незаконным оборотом наркотических средств, психотропных веществ и их прекурсоров (вещество, используемое в производстве, изготовлении или переработке наркотических средств и психотропных веществ), оружия, ядерных материалов и их компонентов, а также иных объектов экспортного контроля;

участие в спасении жизни людей и ликвидации чрезвычайных ситуаций природного и техногенного характера, чрезвычайных экологических ситуаций, в том числе эпидемий и эпизоотий, возникающих в результате аварий, опасных природных явлений, катастроф, стихийных и иных бедствий в составе сил государственной системы предупреждения и ликвидации чрезвычайных ситуаций;

проведение и обеспечение аварийно–спасательных и других неотложных работ;

предупреждение, выявление и пресечение преступлений и административных правонарушений, создающих угрозу безопасности Республики Беларусь.

Одним из основных направлений автоматизации взаимодействия силовых структур Республики Беларусь является создание ситуационно-аналитического центра управления (САЦУ) в кризисных ситуациях. Основная цель создания САЦУ – это обеспечение эффективной консолидации, целенаправленного использования и развития организационных, информационных, технических возможностей нескольких ведомств на основе широкого применения новейших информационно-аналитических методов и технологий как для оперативного управления частями и подразделениями, так и для моделирования кризисных ситуаций для выработки наиболее эффективных управленческих решений.

Создание САЦУ позволит:

осуществить интеграцию распределенных информационных ресурсов силовых структур Республики Беларусь на всех уровнях управления и объединить различные традиционные подсистемы связи (передачи данных, телефонную, видеоконференцсвязь и т.д.) на базе единых технологий, схемных решений и наборов типовых программно-аппаратных средств. При этом основной упор делается на предоставлении максимального сервиса лицам принимающим решения (ЛПР);

прогнозировать состояния объектов управления;

441

моделировать последствия управленческих решений; решать управленческие задачи при изменяющихся целевых функциях и

критериях объекта; решать задачи автоматического перевода оперативной информации в

ситуационную модель, дающую ЛПР возможность оперировать «модулями» системы в реальном времени;

координировать и контролировать реализацию принятых решений; осуществлять визуализацию принятых коллегиально решений; обеспечивать комплексную безопасность, связанную с возрастанием

активности преступных формирований, а также с нарушением в работе производств и коммунальных служб из-за изношенности основных фондов.

Применение САЦУ в деятельности силовых структур Республики Беларусь позволяет обеспечить информационную поддержку руководителей для принятия грамотных и ответственных управленческих решений. Кроме того, САЦУ дает возможность руководителям принимать управленческие решения в условиях жесткого дефицита времени, что актуально и необходимо в современном мире при решении кризисных ситуаций.

Литературные источники

1.Об органах государственной безопасности Республики Беларусь: Закон Респ. Беларусь, 3 декабря 1997 г., № 102-З // Нац. реестр правовых актов Респ. Беларусь. – 2001. – N 2/641.

2.Об органах и подразделениях по чрезвычайным ситуациям Республики Беларусь: Закон Респ. Беларусь, 16 июля 2009 г., № 45-З // Нац. реестр правовых актов Респ. Беларусь.

2009. – № 173. – 2/1597.

3.Об органах пограничной службы Республики Беларусь: Закон Респ. Беларусь, 11 ноября 2008 г. N 454-З// Нац. реестр правовых актов Респ. Беларусь. – 2008. – N 2/1550.

4.Об органах внутренних дел Республики Беларусь: Закон Респ. Беларусь, 17 июля 2007 г. N 263-З// Нац. реестр правовых актов Респ. Беларусь. – 2007. – N 2/1360.

5.О внутренних войсках Министерства внутренних дел Республики Беларусь: Закон Респ. Беларусь, 3 июня 1993 г., № 2341-XII: в ред. Закона от 21.07.2008 г., № 417-З // Нац. реестр правовых актов Респ. Беларусь. – 2004. – № 190. – 2/1092, 2008. – № 184. –2/1514.

6.О Вооруженных Силах Республики Беларусь: Закон Респ. Беларусь, 3 ноября 1992 г., № 1904-XII: в ред. Закона от от 24.07.2002 N 135-З, от 12.05.2009 N 18-З., № 417-З // Нац. реестр правовых актов Респ. Беларусь. – 2001. – № 2/346.

7.Панов, А.В. Разработка управленческих решений: информационные технологии//А. Панов// Горячая линия – Телеком. – 2004. – С. 27–30.

Kudrin I.G.1, Zheleznyakov A.V.1

USING THE COMMAND-ANALYTICAL CENTER OF THE ADMINISTRATION IN THE ACTIVITIES OF THE POWER STRUCTURES OF THE REPUBLIC OF BELARUS

1Faculty internal troops of the educational institutions «The military academy of the Republic of Belarus», Minsk

Summary

In this policy brief examines the use of situation-analytical center of the administration in the activities of the power structures of the Republic of Belarus. It enables to provide informational support of managers for the adoption of responsible administrative decisions in conditions of severe shortage of time.

442

УДК 004.934

Лихачевский Д.В., Бакановский Ю.В., Костюк Т.

СОВРЕМЕННАЯ СИСТЕМА РАСПОЗНАВАНИЯ РЕЧИ

Белорусский государственный университет информатики и радиоэлектроники, Минск

Актуальность

В данной статье рассмотрены структура и алгоритм работы системы распознавания речи, построенная на вероятностных методах обработки речи и модели языка, основными параметрами оценки которой являются точность и качество. Описан обучающий алгоритм и методы оценки для построения N- граммной модели языка.

Основы Систем Распознавания Речи

Основной задачей систем распознавания речи является точность и качество преобразования речевого сигнала в текстовое сообщение независимо от устройств преобразующих сигнал и воздействующих помех. На Рис.1 показана схема двух этапной системы распознавания речи. Предположим входящий звуковой сигнал s(n), который является предложением W, состоящим из последовательности слов, элементов речи.

Рисунок 1. Система распознавания речи

На первом этапе сигнал s(n) преобразуется в вектор признаков - Х, который измеряется каждые 10 мс. На втором этапе в декодере, чтобы сгенерировать наиболее вероятные предложения, вычисляются апостериорные вероятности и выбирается последовательность слов с максимальноправдоподобными вероятностями грамматическихтиких связей [1]:

W'=argmaxP (X /W )P (W )

Чтобы посчитать апостериорную вероятность W' необходимо определить априорную вероятность P(W), последовательности слов W, и оценить вероятность правдоподобия слов W в полученном из акустической модели

векторе признаков X=x1 ,x2 , .. . xN

[2]. N - количество кадров в речевом сигнале

(N кадров в 10 мс). W'=w1 w2 ... wM

- декодированная последовательность слов.

Процесс распознавания речи состоит из [2]:

1.Акустического моделирования, где используется скрытая Марковская модель для присвоения вероятностей фонемам, словам для вычисления P(X/W). Таким образом, акустические модели обучаются на наборе речевых высказываний, записей.

2.Моделирования языка, где модели языка содержат вероятности последовательностей слов. Назначение вероятностей P(W) происходит путѐм

443

обучения моделей языка последовательностям текста. Вероятностный метод, основанный на Марковском допущении, позволяет определить вероятность слова в предложении в зависимости от предыдущих N-1 слов, N-грамм модель:

P(W )=P (w1 w2 .. . wM )= P (wm wm1 ,wm2 .. . ,wmN+1 )

3.Поиск последовательности слов с максимально-правдоподобными

вероятностями грамматических связей в модели языка [3]. Использование методов из теории конечных автоматов позволяет снизить вычислительную нагрузку [4].

Процесс Распознавания Речи

На Рис. 2 показана блок-схема системы распознавания речи. Распознавание речи состоит из: анализа признаков, сопоставления образцов, вычислительных процессов в словаре, акустических и языковых модулей.

Рисунок 2. Блок-схема системы распознавания речи

Анализ Вектора Признаков

Целью анализа вектора признаков является извлечение информации из набора признаков, чтобы охарактеризовать спектральные свойства различных речевых звуков. В качестве набора признаков используются тридцать девять коэффициентов косинусного преобразования Фурье с производной первого и второго порядка, которые считаются каждые 10 мс. В цифровом фильтре происходит дискретизация, квантование, усиление и разбиение на кадры речевого сигнала. Затем, для спектрального анализа сигнала используется преобразование Фурье [5]. Также, осуществляется преобразование частоты по шкале частот Мел, чтобы удалить вариативность сигнала и нормализовать кепстральные коэффициенты для подсчета производной первого и второго порядка.

Акустическая Модель

Задачей акустического моделирования, является определение вероятностной изменчивости набора признаков для каждого звука или слова. Для этих целей используется скрытая Марковская модель [6], чтобы промоделировать спектральные характеристики для каждого звука в речи.

Словарь

В словаре определены все возможные варианты произношения слов [7]. Произношение одного и того же слова разными людьми зависит от контекста, голоса, акцента, поэтому словарь должен содержать все возможные варианты

444

произношения слова, чтобы потом обучить модель распознавать речь разных голосов и в разных контекстах.

Модель Языка

Mодель языка [8] применяется для назначения вероятностей P(W), определенных словосочетаний W и для исключения вычисления ложных гипотез. Существует несколько способов создания модели языка:

-модель основанная на правилах

-вероятностная модель, которая вычисляет вероятности слов из обучающей выборки, текстового материала.

Вданной работе, вероятностная N-грамм модель языка была смоделирована с использованием небольшой обучающей выборки. Поэтому для каждого предложения в обучающей выборке применялся текстовый файл, который определял порядок слов в предложении. Затем, методом подсчета определяли вероятности биграмм слов в обучающей текстовой выборке:

 

 

 

( i

i 1)

C (wi 1 ,wi )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P w w

=

C (wi1)

 

 

 

 

 

 

 

 

 

 

 

где

C w

,w

 

 

 

w

,w

i ) в обучающей

( i1

 

i ) - количество слов биграмм состоящих из (

i1

 

выборке; C (wi) - количество слов униграмм (wi ) в обучающей выборке.

Вслучаях, когда в тестовой выборке содержится мало слов и языковые явления редки, чтобы обучающий алгоритм сходился, применяется сглаживающий алгоритм оценки параметров вероятностей [1].

Для оценки модели языка вычисляется перплексивность модели. Перплексивность моделей - математическая величина, характеризующая предсказательные свойства модели языка на основе тестового корпуса. Перплексивность определяется как «2 в степени кросс-энтропия» [1]. Для одного и того же набора данных, меньшая перплексивность означает лучшую модель языка.

Выводы

Вданной статье изложены основные компоненты и алгоритм работы современной системы распознавания речи. В работе было показано насколько важна обработка сигналов в создании набора признаков и роль статистических методов в обеспечении качественного распознавания речи. Были рассмотрены принципы акустического моделирования и построения вероятностной модели языка на основе N-грамм моделей.

Следующим шагом в развитии статистического обучения будет использование комбинированных моделей языка, добавления в словарь дополнительных слов и обучению распознаванию более длинных предложений.

Литературные источники

[1] Протасов, 2006. Протасов C.B. Обучение с нуля грамматики связей русского языка // X Национальная конференция по искусственному интеллекту с международным участием «КИИ-06». -М. 2006. С. 515-524

445

[2]Lawrence R. Rabiner, B.H. Juang 'Statistical Methods for the Recognition and Understanding of Speech ,' Rutgers University, University of California, Santa Barbara, Georgia Institute of Technology,

[3]Ney H (1984). ‗The use of a one stage dynamic programming algorithm for connected word recognition.‘ IEEE Transactions, Acoustics, Speech and Signal Processing, ASSP-32(2), 263– 271.

[4]Mohri M (1997). ‗Finite-state transducers in language and speech processing.‘

Computational Linguistics 23(2), 269–312.

[5]Atal B S & Hanauer S L. ‗Speech analysis and synthesis by linear prediction of the speech wave.‘ Journal of the Acoustical Society of America 50(2), 637–655.

[6]Rabiner L R & Juang B H (1985). ‗An introduction to hidden Markov models.‘ IEEE Signal

Processing Magazine 3(1), 4–16.

[7]Riley M D et al. (1999). ‗Stochastic pronunciation modeling from hand-labelled phonetic corpora.‘ Speech Communication 29(2–4), 209–224.

[8]Rosenfeld R (2000). ‗Two decades of statistical language modeling: where do we go from here?‘ Proceedings of the IEEE, Special Issue on Spoken Language Processing 88(8), 1270– 1278.

Likhacheuski D., Bakanouski Y., Kastsiuk T.

MODERN SPEECH RECOGNITION SYSTEM

Belarusian State University of Informatics and Radioelectronics, Minsk

Summary

This paper surveys the main components and the algorithm of the speech recognition. The process of analysing a feature vector from a speech signal, methods of the acoustic modeling and a probabilistic language model based on N-gram models were reviewed.

446

УДК 343.98.065

Нерубальская А.Э.

ИДЕНТИФИКАЦИЯ ЗВУКОВЫХ СЛЕДОВ ОКРУЖАЮЩЕЙ СРЕДЫ КАК АКТУАЛЬНАЯ ПРОБЛЕМА КРИМИНАЛИСТИЧЕСКОЙ ЭКСПЕРТИЗЫ ЗВУКОЗАПИСЕЙ РЕСПУБЛИКИ БЕЛАРУСЬ

ГУ «Центр судебных экспертиз и криминалистики Министерства юстиции Республики Беларусь», Минск

Актуальность: исследование звуковых следов окружающей среды, зафиксированных на фонограмме, поступающей для производства криминалистической экспертизы звукозаписей, приобретает особую актуальность в условиях повсеместного распространения звукозаписей в цифровой форме представления, поскольку его результаты позволяют получить дополнительную информацию об условиях производства фонограммы.

Цель исследования: разработать методические рекомендации по идентификации звуковых следов окружающей среды, зафиксированных на фонограмме.

Материалы и методы исследования:

-персональный компьютер IBM AT «Pentium 4»;

-стереонаушники «Technics RP-F880», «AKG K-44»;

-микшер АМ 440;

-эквалайзер FBQ 3102;

-усилитель СМ-7.5;

-акустическая система F-240G;

-эквалайзер DBX DRIVERACK PA-EU;

-аппаратно-программный комплекс «ИКАР ЛАБ II+».

Исследование записей изображения или звука с целью установления фактов, имеющих доказательственное значение, и составление по данным указанного исследования экспертного заключения для его использования в судопроизводстве называется криминалистической экспертизой видео- и звукозаписей [1]. Данный род экспертизы относится к числу новых и подразделяется на два вида: криминалистическую экспертизу видеозаписей, которая в Республике Беларусь только складывается, и криминалистическую экспертизу звукозаписей (далее – КЭЗ), которая уже сформировалась и продолжает развиваться. Объектами исследования при производстве КЭЗ являются «голос и речь человека, звуки других объектов окружающей среды и акустические сигналы звукозаписывающих устройств, зафиксированных на носителях записи (фонограммах)» [2]. Задачи КЭЗ связаны с той или иной следственной ситуацией, возникающей в ходе расследования. Наиболее часто возникает необходимость в решении идентификационных задач, т.е. экспертных задач, основной целью которых является установление факта индивидуально-конкретного тождества или общности групповой принадлежности конкретных материальных объектов [3]. К идентификационным задачам КЭЗ относят: идентификацию личности по голосу и звучащей речи, идентификацию средств звукозаписи, идентификацию

447

источников звуков, сопутствующих зафиксированному на фонограмме разговору. Последняя из названных задач на современном этапе развития КЭЗ требует наиболее пристального внимания ученых, поскольку экспертная практика показывает, что сопутствующие основному разговору звуки, записанные на исследуемой фонограмме, часто содержат ценную доказательственную информацию [2].

Преступление совершается в материальной среде, где каждый объект является источником звуковых следов. Если событие зафиксировано на цифровой носитель, то на фонограмме звуковые следы будут наложены на фон звуковой среды, анализ которого может дать дополнительную информацию о таких обстоятельствах, которые не будут иметь отражения в обычных материальных следах.

ВКЭЗ звуковая среда понимается как совокупность звуковых следов, которые одновременно генерируются различными источниками. Источником звука является физическое тело, которое под действием силы делает колебательные движения, воспринимаемые человеком как звук. Перечислить источники звука, которыми являются все материальные объекты органической

инеорганической природы, довольно сложно, но, в общем, их можно разделить на четыре группы: 1) люди (звуковая речь, неречевые звуки); 2) живые организмы (звуки животных, птиц, насекомых и др.); 3) неживые объекты и их системы (звуки инструментальных инструментов, работающих станков, агрегатов, транспорта, инструментов, орудий взлома, выстрела и др.); 4) явления природы (звук грома, шум водопада, обвала, горения, прибоя и др.).

Решение задачи идентификация источника звука по его звуковым проявлениям на фонограмме основана на том, что спектрально-временные характеристики механических колебаний, создаваемых источниками, находятся в очень сложной функциональной зависимости от целого ряда факторов. К ним относятся масса, сила, упругие свойства, среда, в которой происходят колебания, и т.д. Вместе с тем указанное многообразие факторов в каждом конкретном случае сохраняет относительную неизменность, поэтому возможность установления конкретного источника звука по его фонограмме все же существует. И это установление основано на применении методов и средств акустической спектроскопии. Идентификация спектра звуковых следов на спорной фонограмме (т.е. той фонограммы, которая поступила на экспертное исследование) со спектром звуковых следов на фонограмме-образце (сравнительной фонограмме) позволяет в дальнейшем диагностировать объектисточник звука. Исследование, измерение и описание всех типов звуковых колебаний происходит в основном во временной и частотной областях, на базе аудитивного (перцептивного) и инструментального (спектрального, амплитудного анализа и вероятно-статистической оценки) анализа [4].

Впоследние годы широкое распространение получила цифровая техника, в том числе и цифровые звукозаписывающие устройства. Внести изменения в цифровую фонограмму значительно проще, чем в аналоговую, причем даже

лицам, не обладающим специальными познаниями в области

448

программирования [5]. Это обусловливает необходимость предварительной проверки поступающей на экспертное исследование фонограммы на наличие/отсутствие монтажа. Отметим, что обоснованный вывод о достоверности фонограмм, представленных в цифровой форме, возможен только при квалифицированном и высокотехнологичном экспертном исследовании.

Сегодня значительные трудности в ходе идентификации звуковых следов при экспертном исследовании возникают в связи с отсутствием автоматизированной базы данных (АБД). Такой автоматизированный справочно-поисковый аппарат позволит в кратчайшие сроки получать информацию о необходимом источнике звука, что будет содействовать значительному сокращению трудоемкости работы эксперта, сроков проведения КЭЗ, повысит качество научной обоснованности выводов заключения экспертов.

Необходимо создать такую базу данных, которая будет объединять два вида исследования: аудитивный и инструментальный.

Аудитивный вид исследования будет решаться с помощью фонотеки, которая содержит фонограммы звуковых следов. Однако данную фонотеку необходимо постоянно обновлять и пополнять. А инструментальный вид исследования будет решается с помощью различных методов анализа (например, спектрального и амплитудного). И только объединение двух видов исследования позволит создать АБД, которая действительно автоматизирует процесс идентификации звуковых следов.

Выводы: Идентификация звуковых следов окружающей среды, зафиксированных на фонограмме возможна только при наличии автоматизированной базы данных.

Автоматизированная база данных должна непрерывно пополняться и обновляться.

Сам процесс идентификации должен сочетать два вида исследования: аудитивное и инструментальное.

Инструментальное исследование должно производиться с использованием специальных программных комплексов новейшего поколения.

Литературные источники:

1.Каганов, А.Ш. Криминалистическая экспертиза звукозаписей /А.Ш. Каганов. – М. : Изд-во «Юрлитинформ», 2005. – 272 с.

2.Подготовка и назначение судебных экспертиз: Пособие для следователей, судей и экспертов / Министерство юстиции Республики Беларусь, НИУ «Научно-исследовательский институт проблем криминологии, криминалистики и судебной экспертизы» ; редкол.: А.С. Рубис (отв. ред.) [и др.]. – Минск : Харвест, 2006. – 320 с.

3.Зинин, A.M. Судебная экспертиза : учебник. / A.M. Зинин, Н.П. Майлис. – М : Право и закон; Юрайт-Издат, 2002. – 320 с.

4.Ложкевич, A.A. Основы экспертного криминалистического исследования магнитных фонограмм / А.А. Ложкевич, В.А. Снетков, В.А. Чиванов, В.Л. Шаршунский. – Москва : ВНИИ МВД СССР, 1977. – 172 с.

449

5. Костикова, Н.А. Особенности использования звуковой информации при расследовании преступлений : автореф. дис. ... канд. юрид. наук : 12.00.09 / Н.А. Костикова ; Москов. гос. юрид. акад. – Москва, 2007. – 30 с.

Nerubalskaya N.E.

IDENTIFICATION OF THE ENVIRANMENTAL AUDIO MARKS SA THE ACTUAL PROBLEM IN FORENSIC EXAMINATION OF AUDIO RECORDING

State Institution "Centre of forensic examination and Criminalistics of the Ministry of Justice Republic of Belarus", Minsk

Summary

In this article considers scientific problems of one of the actual researches carrying out in forensic examination of audio recording identification of the environmental audio marks fixed on a phonogram. Methodical recommendations offered to increase the efficiency of this phonogram research in digital presentation.

450