Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ПР2 / Методические указания к практической работе №8

.pdf
Скачиваний:
2
Добавлен:
18.02.2023
Размер:
303.34 Кб
Скачать

КАФЕДРА РАДИОЭЛЕКТРОНИКИ

УО «ПОЛОЦКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

К ВЫПОЛНЕНИЮ ПРАКТИЧЕСКИХ РАБОТ

по дисциплине «ОСНОВЫ ЗАЩИТЫ ИНФОРМАЦИИ»

РАЗДЕЛ III

КАНАЛЫ УТЕЧКИ РЕЧЕВОЙ ИНФОРМАЦИИ

НОВОПОЛОЦК 2015

РАДИОТЕХНИЧЕСКИЙ ФАКУЛЬТЕТ

КАФЕДРА РАДИОЭЛЕКТРОНИКИ

МАТЕРИАЛЫ ПОДГОТОВИЛА:

старший преподаватель кафедры радиоэлектроники Бураченок Ирина Брониславовна

РАДИОТЕХНИЧЕСКИЙ ФАКУЛЬТЕТ

Основы защиты информации

3

 

 

 

 

ПРАКТИЧЕСКАЯ РАБОТА №8

ТЕМА: Оценка первичных признаков элементов речевого сигнала.

ЦЕЛЬ РАБОТЫ: С использованием языка программирования провести оценку тонкой структуры информационных признаков элементов речевого сигнала.

Результат обучения:

После успешного завершения занятия пользователь должен:

знать теоретические сведения о простых и сложных сигналах, иметь представление о преобразовании Фурье и спектральном анализе сигналов;

получить навыки анализа звуков речевого сигнала.

Используемая программа: MatLab R2013a, Mathcad 15.0 или любой язык программирования С++, С#, Visual Basic, Java и др.

План занятия:

1.Изучение кратких теоретических сведений.

2.Выполнение задания.

3.Оформление отчета.

1.КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

Понятие гармонического сигнала. Гармоническим называется сигнал вида

 

 

 

x(t) Asin( t 0 )

 

 

(1)

A - амплитуда сигнала,

- частота, 0 - начальная фаза. Величина,

стоящая в скобках,

(t) t 0

называется мгновенной фазой. Часто удобно

вместо

 

использовать

величину f

 

. Это

величина обратная периоду, равная

количеству

колебаний в

 

 

2

 

 

 

 

единицу времени.

В ряде случаев гармонический сигнал удобно представить как действительную часть

комплексного числа Aei t i 0 .

Чуть более сложную форму сигнала можно смоделировать, сложив два гармонических сигнала:

x(t) A1 sin( 1t 01 ) A2 sin( 2t 02 )

(2)

Понятие преобразования Фурье. Чтобы представить в виде гармоник непериодический сигнал не на конечном интервале, а на всей оси, необходимо использовать множество гармоник с непрерывным набором частот. Такое представление можно записать следующим образом:

 

 

Бураченок Ирина Брониславовна

3

4

Бураченок Ирина Брониславовна

 

 

 

 

 

 

x(t) A( ) sin(t ())d

(3)

То есть суммируются синусоиды с разными частотами, у каждой своя амплитуда и начальная фаза.

Как же найти нужные амплитуды и фазы для интересующих нас сигналов? Для этого вспомним, что синусоиду с ненулевой начальной фазой можно представить как сумму синуса и косинуса с нулевыми начальными фазами:

 

Asin(t ) a sin(t) b cos(t)

(4)

где a Acos ,

b Asin . Коэффициенты a и b для гармоник найти оказывается

гораздо проще, чем амплитуду и фазу. А именно:

 

 

 

 

a() x(t) sin(t)dt ,

b() x(t) cos(t)dt

(5)

 

 

 

 

То есть надо найти интеграл от произведения сигнала на синус или косинус

соответственно.

 

 

 

Попробуйте представить себе, что значения

x(t) , sin t и cost

в каждый момент

времени t это координаты векторов (такие вот бесконечномерные вектора). Тогда формулы (5) есть не что иное, как скалярные произведения этих векторов, то есть проекции вектора

x(t)

на вектора sin t и

cost . Вектор, соответствующий сигналу,

мы представляем в

виде комбинации базисных векторов, которым являются синусы и косинусы.

 

После того как вычислены a() и b() при желании легко можно найти амплитуду

и фазу каждой гармоники.

 

 

 

 

 

Приведенные выше формулы для краткости и удобства аналитических расчетов

принято писать в комплексной форме. Вместо формулы (3) пишут:

 

 

 

 

 

1

 

 

 

 

 

x(t)

X ()ei t d

(6)

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

вместо уравнений (5):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X ( ) x(t)e i t dt

(7)

 

 

 

 

 

 

 

 

Здесь

X ( ) Aei Acos iAsin , то есть действительная часть этой величины

есть

b() ,

а мнимая есть

a() . Выражение (7) называют прямым преобразованием

Фурье, (6) – обратным преобразованием Фурье. Благодаря комплексному представлению получается одна формула для прямого преобразования вместо двух. Кроме того, экспоненты проще интегрировать, чем синусы и косинусы и, соответственно, проще находить аналитические выражения для спектров.

Теперь вспомним, что экспериментально снимаемые и обрабатываемые на компьютере сигналы представляют собой временные ряды. То есть значения сигнала известны только в

дискретные моменты времени: tn n t ,

n 0

N 1. В результате интегралы

приходится менять на суммы:

N 1

xn x(tn ) 2 X (k )ei 2 kn/ N (8)

k 0

 

 

4

Практические занятия

Основы защиты информации

 

5

 

 

 

 

 

 

N 1

 

 

X k X ( k ) t x(tn )e i 2 kn/ N

 

(9)

n0

 

 

Преобразование Фурье становится таким же дискретным, как и сигнал:

k

k .

Спектральное разрешение (наименьший шаг по частоте) определяется длиной анализируемого ряда N2 t . Кроме того, появляется предельная частота max t .

Колебания с более высокими частотами просто невозможно анализировать, так как на период приходится в среднем меньше двух значений во временном ряде.

Величины xn и X k связаны равенством Парсеваля:

N 1

 

 

1

N 1

 

 

 

 

 

xn

 

2

 

 

X k

 

2

(10)

 

 

 

 

 

 

 

 

 

n0

 

 

N k 1

 

 

 

 

 

То есть сумма квадратов значений в сигнале пропорциональна сумме квадратов амплитуд гармоник. В случае если сигнал представляет собой ток или напряжение в цепи, сумма квадратов значений имеет смысл мощности. Равенство Парсеваля говорит, что эта

мощность распределяется по гармоникам. Поэтому график величины X k как функции

частоты называется спектром мощности. Иногда кроме спектра мощности (отражающего амплитуды гармоник) используют также спектр фаз.

Понятие речевого сигнала.

Речь – это процесс, частотный спектр которого находится в пределах от 50…100 до 8000…10000 Гц. Установлено, что качество речи остается весьма удовлетворительным, если ограничить спектр снизу и сверху частотами 300 и 3400 Гц. Эти частоты приняты Международным союзом электросвязи (МСЭ) в качестве границ эффективного спектра речи. При указанной полосе частот сохраняется хорошая разборчивость речи и удовлетворительная натуральность ее звучания.

Звуки речи – это колебания воздушной среды, вызванные органами речи. Звуки делятся на тоны (музыкальные звуки) и шумы (немузыкальные звуки).

Тон – это периодические (ритмичные) колебания голосовых связок.

Шум – это непериодические (неритмичные) колебания звучащего тела, например, губ.

Гласные состоят из тона, т.е. голоса при отсутствии преграды, а согласные из шума (или шума и тона), т.е. с участием преграды.

Звуки речи различаются по высоте, силе и длительности.

Высота звука – это число колебаний в секунду (Гц). Она зависит от длины и натянутости голосовых связок. Более высокие звуки имеют более короткую волну. Человек может воспринимать частоту колебаний, т.е. высоту звука в диапазоне от 16 до 20 000 герц. Один герц – одно колебание в секунду. Звуки ниже этого диапазона (инфразвуки) и выше этого диапазона (ультразвуки) человек не воспринимает в отличие от многих животных (кошки и собаки воспринимают до 40 000 Гц и выше, а летучие мыши даже до 90 000 Гц).

Основные частоты общения людей находятся в пределах обычно 500 – 4000 Гц. Голосовые связки производят звуки от 40 до 1700 Гц. Например, бас начинается обычно с 80 Гц, а сопрано определяется в 1300 Гц. Собственная частота колебаний барабанной перепонки – 1000 Гц. Поэтому самые приятные для человека звуки – шум моря, леса – имеют частоту около 1000 Гц.

Диапазон колебаний звуков речи мужчины составляет 70-180 Гц в отличие от женщин, говорящих с частотой в 180-330 Гц (поскольку у мужчин голосовые связки в среднем 23 мм, а у женщин –18 мм, а чем длиннее связки, тем ниже тон).

 

 

Бураченок Ирина Брониславовна

5

6

Бураченок Ирина Брониславовна

 

 

 

 

Сила звука (громкость) зависит от длины волны, т.е. от амплитуды колебаний (величины отклонения от первоначального положения). Амплитуду колебаний создают напор воздушной струи и поверхность звучащего тела.

Сила звука измеряется в децибелах. Шепот определяется в 20-30 дБ, обычная речь от 40 до 60 дБ, громкость крика доходит до 80-90 дБ. Певцы могут петь с силой до 110-130 дБ. В книге рекордов Гиннеса зафиксирован рекорд четырнадцатилетней девочки, перекрывшей криком взлетающий авиалайнер с громкостью двигателей в 125 дБ. При силе звука свыше 130 дБ начинается боль в ушах.

Разным звукам речи свойственна разная сила. Мощность звука зависит от резонатора (резонаторной полости). Чем меньше ее объем, тем больше мощность. Звуки одинаковой силы, но различной высоты воспринимаются как звуки различной громкости. Следует отметить, что сила звука и громкость не равнозначны, поскольку громкость – это восприятие интенсивности звука слуховым аппаратом человека. Ее единица измерения - фон, равный децибелу.

Гласные звуки речи имеют в среднем длительность около 0,15 с, согласные

– около 0,08 с (звук «П» – около 30 мс).

Длительность звука, т.е. время колебания измеряется в миллисекундах. Звук имеет сложный состав. Он состоит из основного тона и обертонов

(резонаторных тонов).

Основной тон – это тон, порожденный колебаниями всего физического

тела.

Обертон – частичный тон, порожденный колебаниями частей (половины, четверти, восьмой и т.д.) этого тела. Обертон («верхний тон») всегда выше основного тона в кратное число раз, отсюда и его название. Например, если основной тон – 30 Гц, то первый обертон будет составлять 60, второй 90, третий – 120 Гц и т.д. Он вызывается резонансом, т.е. звучанием тела при восприятии звуковой волны, имеющей частоту одинаковую с частотой колебаний этого тела. Обертоны обычно слабы, но усиливаются резонаторами. Интонация речи создается изменением частоты основного тона, а тембр – изменением частоты обертонов.

Тембр – это своеобразная окраска звука, создаваемая обертонами. Он зависит от соотношения основного тона и обертонов. Тембр позволяет отличать один звук от другого, различать звуки различных лиц, мужскую или женскую речь. Тембр у каждого человека строго индивидуален и уникален как отпечаток пальцев. Иногда этот факт используется в криминалистике.

Форманта – это обертоны, усиленные резонаторами, которые характеризуют данный звук. В отличие от голосового тона форманта образуется не в гортани, а в резонирующей полости. Поэтому она сохраняется и при шепоте. Другими словами, это полоса концентрации частот звука, получающая наибольшее усиление благодаря влиянию резонаторов. При помощи формант мы можем количественно отличать один звук от другого. Эту роль выполняют речевые форманты. Самые важные в спектре гласного звука первые две форманты, наиболее близкие по частоте к основному тону. Причем для голоса каждого человека характерны свои голосовые форманты. Они всегда выше первых двух формант.

Гласные звуки образуются следующим образом. Голосовые складки перекрывают путь потоку воздуха. Легкие нагнетают давление под ними и в какой-то момент воздух прорывается. Давление падает и голосовые складки опять схлопываются. Получается почти периодическая последовательность прорывов воздуха. Эти «воздушные импульсы» достаточно коротки и поэтому в их спектре присутствует большое количество кратных гармоник. Пройдя сквозь голосовые складки, воздух попадает в голосовой тракт, образованный глоткой и ротовой полостью. Он действует как резонатор, то есть сигналы с частотами близкими к резонансным усиливаются (или, по крайней мере, почти не затухают),

 

 

6

Практические занятия

Основы защиты информации

7

 

 

 

 

а остальные быстро затухают. Резонансные частоты зависят от положения языка, губ, степени открытости рта и других регулируемых человеком параметров. В результате из большого количества гармоник в сигнале остаются только те, частоты которых близки к резонансным. Разные гласные звуки отличаются этим набором резонансных частот, выделяющих нужные гармоники. Частота исходного импульсного сигнала называется частотой основного тона и отвечает за тембр голоса (низкий голос или высокий).

Таблица 1 – Примерные частоты первых двух формант русских гласных

Гласный звук

Форманта F1

Форманта F2

A

800

1600

О

500

1000

У

300

600

И

500

2500

Э

500

2000

Формантная характеристика согласных очень сложна и трудноопределима, но гласные с достаточно надежностью могут характеризоваться при помощи двух первых формант.

2.ПРАКТИЧЕСКАЯ ЧАСТЬ

1.Программирование расчета спектра мощности

Установите частоту дискретизации 44100Гц и загрузите в среду программирования файлы с расширением *.wav (микрофонная запись, записанных вами гласных звуков).

В таблицу 1 занесите данные длительности полученных сигналов. Таблица 1 – Результаты оценки длительности гласных звуков

 

Гласные

Произнесенные отдельно гласные,

 

длительность, мс

 

 

А

Ударный

230*

 

Неударный

140*

 

 

 

О

Ударный

220*

 

Неударный

 

 

 

 

 

У

Ударный

190*

 

Неударный

110*

 

 

 

И

Ударный

180*

 

Неударный

160*

 

 

 

Э

Ударный

200*

 

Неударный

 

 

 

 

 

Напишите программу с использованием любого известного вам языка программирования, осуществляющую построение спектра мощности, записанных вами сигналов.

Исходные данные представляют собой временной ряд значений сигнала: xn x(tn ) ,

tn n t , n 0

N 1.

Дискретное преобразование Фурье сигнала представляет собой комплексную величину

N 1

 

X k X ( fk ) t x(tn )e i 2 kn/ N

(1)

n 0

 

 

Бураченок Ирина Брониславовна

7

8

Бураченок Ирина Брониславовна

 

 

 

 

Нетрудно видеть, что ее действительная и мнимая части равны:

N 1

 

 

 

 

 

 

 

N 1

 

 

 

Re X k t x(tn ) cos(2 kn / N ) , Im X k

t x(tn ) sin(2 kn / N ) .

 

(2)

n0

 

 

 

 

 

 

 

n0

 

 

 

Здесь fk k f , f

1

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислив эти величины для k

от 0

до

N 1, вы, таким образом,

получите

разложение сигнала на гармонические составляющие с частотами fk :

 

 

N 1

 

 

 

N 1

 

 

 

 

 

 

 

xn x(tn ) f X k ei 2 kn/ N

f Re X k cos(2 kn / N ) Im X k sin(2 kn / N )

(3)

k 0

 

 

 

k 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Амплитуда гармонической составляющей на частоте

fk :

 

 

 

 

 

 

 

 

 

 

 

 

Pk

 

(Re X k )2 (Im X k )2

 

 

(4)

График этой величины

в зависимости от

частоты fk и

называется спектром

мощности

cигнала.

 

 

 

 

 

 

 

 

 

 

 

 

При написании программы рекомендуется следующая последовательность действий:

 

1) Задайте длину

N и частоту дискретизации

Fs

(количество значений в ряде на

единицу времени) временного ряда. По частоте дискретизации вычислите интервал дискретизации t 1/ Fs .

2)Файл, записанного вами звука, запишите в массив и отобразите на графике.

3)Напишите процедуру расчета действительной и мнимой части преобразования

Фурье на частоте fk .

4)Сделайте перебор значений k , для которых вычисляйте частоту fk ,

действительную и мнимую часть преобразования Фурье и по ним амплитуду.

5) Постройте график зависимости амплитуды гармонических составляющих от частоты.

2. Программирование расчета основного тона и основных формант.

Для имеющихся файлов (микрофонных записей всех гласных звуков, произнесенных вашим голосом) определите частоту основного тона вашего голоса и проверьте, соответствует ли она заданному диапазону (см. ранее средняя частота для мужских голосов 129 Гц, для женских голосов 240 Гц). Проверьте, близки ли полученные вами гармоники с большой амплитудой резонансным частотам для звуков «А» и «О», приведенным в таблицах 2 и 3.

Таблица 2 – Резонансные частоты и ширина полос для гласного /А/, Гц

 

F0

F1

F2

F3

F4

F5

F6

Частота

273.5

574.6

994.1

2404.8

2711.4

3796.5

4735.3

 

 

 

 

 

 

 

 

Ширина

72.4

78.1

48.3

77.7

102.5

145.6

221.8

полосы

 

 

 

 

 

 

 

 

 

8

Практические занятия

 

Основы защиты информации

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 3 – Резонансные частоты и ширина полос для гласного /О/, Гц

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F0

F1

F2

F3

F4

 

F5

F6

 

 

Частота

287.6

497.1

914.2

2316.4

2635.1

 

4030.9

4728.3

 

 

 

 

 

 

 

 

 

 

 

 

 

Ширина

72.4

100.9

47.1

67.9

87.6

 

142.3

189.5

 

 

полосы

 

 

 

 

 

 

 

 

 

 

 

 

Постройте формантный треугольник (кривую, устанавливающую разброс зависимостей частоты второй форманты F2 от частоты первой форманты F1) для всех гласных звуков, произнесенных вами.

Продемонстрируйте полученный вами результат преподавателю!

3. СОДЕРЖАНИЕ ОТЧЕТА

Цель работы.

Оформить и представить код реализации.

Полученные расчетные данные представить в таблицах. Ответить на контрольные вопросы.

4. КОНТРОЛЬНЫЕ ВОПРОСЫ

1.Какова должна быть начальная фаза сигнала, чтобы он совпадал с синусоидой? А с косинусоидой?

2.Чему равен сдвиг по фазе (различие в начальных фазах) между синусом и косинусом?

3.Чему равен период гармонического сигнала с частотой 1?

4.Какова должна быть частота , чтобы период равнялся 1?

5.При какой разности начальных фаз (кроме нулевой) два сигнала с частотой будут совпадать?

6.С какой основной целью необходимо построение спектров сигналов?

7.Дайте определение речевого сигнала. Какими основными признаками характеризуется речевой сигнал?

8.Какие методы оценки основного тона вам известны? Особенности частоты основного тона для мужского и женского голосов?

9.Откуда берутся форманты? Укажите известные вам методы оценки формант?

СПИСОК ИСТОЧНИКОВ

Основная литература:

1.Баскаков, С.И. Радиотехнические цепи и сигналы: учебник для вузов по спец. «Радиотехника». – 2-е изд., перераб. и доп. / С.И. Баскаков. – М.: Высш. шк., 1988. – 448 с.

2.Бурдик, В.С. Анализ гидроакустических систем./ В.С. Бурдик, пер. с англ. – Л.: Судостроение, 1988. – 392с.

3.Сапожков, М. А. Акустика: Справочник. / М. А. Сапожков – М.: Радио и связь,

1989 – 336с.

4.Сапожков, М.А. Звукофикация помещений. Проектирование и расчет./ М. А. Сапожков. – Издательство: Связь, 1979.

 

 

Бураченок Ирина Брониславовна

9

10

Бураченок Ирина Брониславовна

 

 

 

 

5.Сергиенко, А. Б. Цифровая обработка сигналов. /А. Б. Сергиенко. СПб, Питер,

2002. — 608 с.

6.Скучик, Е. Основы акустики. / Е. Скучик. – Том 1. М.: Мир, 1976, 520

7.Сорокин, В.Н. Синтез речи./ В.Н. Сорокин.– М.: Наука, 1992.

8.Фант, Г. Акустическая теория речеобразовання. / Г.Фанг. – М.: Наука, 1964.

283 с.

9.Фланаган, Дж. Анализ, синтез и восприятие речи: Пер. с англ./Под ред.А. А. Пирогова. / Дж. Фланаган. – М.: Связь. 1968. 396 с.

Дополнительная литература:

10. Тихонов, В.И. Статистический анализ и синтез радиотехнических устройств и систем: учеб. Пособие для вузов / В.И. Тихонов, В.Н. Харисов. – М.: Радио и связь, 1991. – 608 с.

11. Радиотехнические системы: Учеб. для вузов по спец. «Радиотехника» / Ю. П. Гришин, В. П. Ипатов, Ю. М. Казаринов и др.; Под ред. Ю. М. Казаринова. — М.: Высш.

шк., 1990. — 496 с.

12.Ахмад, Х. М. Введение в цифровую обработку речевых сигналов : учеб. пособие / Х. М. Ахмад, В. Ф. Жирков ; Владим. гос. ун-т. – Владимир: Изд-во Владим. гос. ун-та, 2007. – 192 с.

13.Гробман, М. З. Выделение скрытых периодичностей и формантный анализ речи. Распознавание образов: теория и приложения речевых сигналов / М. З. Гробман, В. И. Тумаркин. – М. : Наука, 1977.

14.Потапова, Р. К. О типологических особенностях слога. Распознавание образов: теория и приложения / Р. К. Потапова. – М.: Наука, 1977. – 296 с.

15.Сорокин, В. Н. Элементы кодовой структуры речи. Распознавание образов: теория и приложения. – М.: Наука, 1977. – с. 42 – 60.

 

 

10

Практические занятия