Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Boriskevich_anali.pdf
Скачиваний:
0
Добавлен:
13.05.2026
Размер:
592.22 Кб
Скачать

Министерство образования Республики Беларусь

Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ

 

 

 

 

Кафедра сетей и устройств телекоммуникаций

Р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

И

 

 

 

 

 

 

 

 

 

У

 

 

 

 

АНАЛИЗ ЧАСТОТНЫХ И ВРЕМЕННЫХ СВОЙСТВ

 

 

 

 

 

 

СЛУХОВОГО АППАРАТА

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

Методические указания

 

 

 

 

 

 

 

 

 

к лабор торной работе

 

 

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

по дисциплинам «Цифров я обр ботка речи и изображений» и

 

 

 

«Защита

 

сообщений и объектов связи

 

 

 

 

 

 

речевых

 

 

 

 

 

 

 

 

от несанкционированного перехвата»

 

 

 

 

 

 

т

 

 

 

 

 

 

 

для студентов сп циальности «Сети телекоммуникаций»

 

 

 

 

дневной, в ч рн й и заочной форм обучения

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

 

 

 

 

Минск 2003

УДК 621.391.25 (075.8) ББК 32.811.4 я 73

А64

Составители:

А.А. Борискевич, В.К. Конопелько

 

 

 

 

 

 

 

 

 

 

 

 

Р

 

 

 

 

 

 

 

 

 

 

 

И

 

 

Анализ частотных и временных свойств слухового аппарата: Метод.

А64 указания к лабораторной работе по дисциплинам «Цифровая обработка

 

 

 

 

 

 

 

 

 

 

УИР

 

 

речи и изображений» и «Защита речевых сообщений и объектов связи от

 

несанкционированного перехвата» для

студентов спец. «Сети

 

 

 

 

 

 

 

 

 

Г

 

 

 

телекоммуникаций» дневной, вечерней и заочной форм обучения/Сост.

 

 

 

 

 

 

 

 

 

Б

 

, 2003. – 19 с.: ил.

 

А.А. Борискевич, В.К. Конопелько. – Мн.:

 

 

 

В данных методических указаниях рассмотрены основные спектральные и временные свойства

 

 

 

 

 

 

 

 

а

 

 

 

 

психоакустической модели слуховой системы. Приведено подробное описание данной модели в

 

частотной области. Сведения, представленные в н стоящих методических указаниях, могут быть

 

использованы для решения задач обработки, сж тия и з щиты звуковых сигналов.

 

 

 

 

 

 

 

к

 

 

 

УДК 621.391.25 (075.8)

 

 

 

 

 

 

е

 

 

 

 

ББК 32.811.4 я 73

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

 

 

 

 

 

© А.А.Борискевич, В.К.Конопелько, составление, 2003 © БГУИР, 2003

1. ЦЕЛЬ РАБОТЫ

Изучение спектральных и временных свойств психоакустической модели слуховой системы для решения задач обработки, сжатия и защиты звуковых сигналов.

2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 2.1. Введение

статистической и психофизи-ческой избыточности. СокращениеРстатистической избыточности основывается на учете свойств самих звуковых сигналов. Она обусловлена

Человек в состоянии принимать огромные потоки информации. Но сознательно он способен обрабатывать лишь около 100 бит/с информации. Поэтому можно говорить о присущей звуковым сигналам существенной избыточности. Важной проблемой при цифровом представлении звуковых сигналов является сокращение имеющейся в них

наличием корреляционной связи между соседними отсчетами звуковогоИсигнала при его дискретизации. Устранение статистической избыточности не приводит к значительному

учитывающие такие свойства слухового восприятия, Гкак маскировка, предмаскировка и после-маскировка. Если известно, какие составляющие звукового сигнала ухо воспринимает,

уменьшению скорости цифрового потока. Наиболее

перспективными с этой точки зрения

оказались методы сокращения психофизической

избыточностиУ

звуковых сигналов,

а составляющие сигнала можно отброситькоторые. Кроме того, сигналы можно квантовать с возможно

а какие нет вследствие явления маскировки, то нужно выделить и затем передать по каналу

связи лишь те части сигнала,

ухоБспособно воспринять, а неслышимые

меньшим разрешением так, чтобы шумы в нтов ния, изменяясь по величине с изменением уровня самого сигнала, еще оставались бы неслышимыми, т.е. маскировались бы исходным

сигналом. Учет психоак ских закономерностей слухового восприятия определяет

качество систем кодирования есо сжати м цифровых данных. Методами устранения психофизической избы очнос и можно обеспечить сжатие цифровых аудиоданных в 10-12

раз без существенных

ерь в качес ве.

2.2. Пс хоакуст

ческие особенности слухового восприятия

 

 

устич

 

по

Описан е характеристик любой слуховой системы осуществляется по частотно-

пороговым кривыми, которые отражают предельные значения интенсивности (или мощности

звукового дав ения) в зависимости от частоты звуковых колебаний. Частотно-пороговые

,

полученные

для слуховой системы в целом, получили название кривых

слышкривыебмости. Чувствительность слуха оценивается минимальной интенсивностью звука, при Бкоторой человек может отличить звук от постоянно существующего фона собственных шумов. Интенсивность, при которой звук обнаруживается с вероятностью 0,5 (в 50% случаев), называется порогом слышимости или абсолютным порогом для данного сигнала.

 

 

Р

 

И

Рис.1. Кривая минимального порога слышимости слухового аппарата человека

в тишине

У

 

Кривая порога слышимости (рис.1), характеризующая наименьшую интенсивность

звука определенной частоты, который может быть услышан человеком в тишине, хорошо

аппроксимируется с помощью нелинейной функции

Г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,8

 

Б

 

3

 

 

4

 

 

T ( f ) =3,64( f /1000)

 

6,5e

 

 

+10

 

( f /1000)

 

,

(1)

где T(f) – порог слышимости, дБ; f

стота

звукового

сигнала,

Гц. Данная

кривая

ч

 

представляет собой геометрическое место точек, которые соответствуют тональным

компонентам разных частот, имеющих один ковую громкость. Анализ усредненного

графика порога слышимости , что слуховая система человека чувствительна к

частотам в диапазоне 0,01–20 кГц. Наибольшая чувствительность у человека наблюдается на

средних частот

2–5 кГц. Порог слышимостик

сигнала на частоте около 3 кГц составляет

приблизительно 0 дБ. Порог слышимостипоказывает значительно повышается в области низких (менее 200 Гц) и высоких (более 10 кГц) час от и может достигать значения громкости звука 40 дБ

и выше. Следовательно, для слабых сигналов амплитудно-частотная характеристика слуха является нелинейн й, и, как следствие, слабые низкочастотные и высокочастотные

составляющие с гнала м г быть неслышны. Кривые слышимости позволяют оценить

 

ут

работо-способность слуховой системы по ряду признаков: диапазону воспринимаемых

частот, по осе частот, в пределах которой чувствительность максимальна, абсолютным

значениям звукового давления и их изменениям в зависимости от частоты.

и

 

Одно из важных свойств слухового аппарата человека является его ин-тегрирующая

способностьл, т.е. группирование частотных составляющих звука в определенные частотные кр т ческ е полосы. Слуховая система сравнивает полезный сигнал и мешающий шум по нтенс вности в пределах критических полос слуха, оценивая порог слышимости.

Крит ческая полоса слуха является полосой, за пределами которой субъективные ощущения звука сильно изменяются.

Бслуховой системы.

На рис.2 и 3 схематически показан метод определения ширины критической полосы

 

Р

Рис. 2. Определение ширины критической полосы при маскировании узкополосного

И

шумового компонента двумя тональными компонентами

У

 

Узкополосный шумовой сигнал маскируется двумя близко распо-ложенными

тональными компонентами, расстояние f между которыми постепенно увеличивается. На рис.2,б представлена зависимость поведения порога обнаружения шумовой компоненты от

изменения расстояния между двумя тональными компонентами f . Данный порог остается

 

 

 

 

 

 

 

 

 

 

Б

постоянным до тех пор, пока частотное расстояние между тональными компонентами

остается в пределах критической полосы f

к.п

. Вне полосы порог быстро уменьшается.

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

Рис.3. Определение ширины критической полосы при маскировании тонального

б

компонента двумя узкополосными шумовыми компонентами

 

 

 

 

 

 

 

 

 

 

На рис. 3 приведен случай, когда в качестве маскируемого сигнала выступает

и

 

, а в качестве маскирующих сигналов две узкополосные шумовые

тональная компонентал

компоненты (рис.3,а). Поведение порога обнаружения для тональной компоненты (рис.3,б) аналог чно рис.2,б.

В таблице представлено разбиение слышимого диапазона частот на критические полосы с соответствующими центральной частотой и шириной полос идеализированного

банка фильтров (рис.4) с прямоугольными амплитудно-частотными характеристиками,

Бкоторый позволяет качественно воспроизвести звуковые сигналы.

 

 

 

Разбиение слышимого частотного диапазона на критические полосы

 

 

 

 

в психоакустической модели слухового аппарата

 

 

 

 

 

 

 

 

 

 

Номер

 

Центральная частота, Гц

Нижняя и верхняя частоты,

 

критической

 

 

ширина критической полосы, Гц

 

 

полосы

 

 

 

 

 

 

 

1

 

50

20100

 

100

 

2

 

 

 

 

150

 

 

100200

 

 

100

 

 

3

 

 

 

 

250

 

 

200300

 

 

100

 

 

4

 

 

 

 

350

 

 

300400

 

 

100

 

 

5

 

 

 

 

450

 

 

400510

 

 

110

 

 

6

 

 

 

 

570

 

 

510630

 

 

120

 

 

7

 

 

 

 

700

 

 

630770

 

 

140

 

 

8

 

 

 

 

840

 

 

770920

 

 

150

 

 

9

 

 

 

1000

 

 

9201080

 

 

160

 

 

10

 

 

 

1170

 

 

10801270

 

 

190

 

 

11

 

 

 

1370

 

 

12701480

 

 

210

 

 

12

 

 

 

1600

 

 

14801720

 

 

240

 

 

13

 

 

 

1850

 

 

17202000

 

 

280

 

 

14

 

 

 

2150

 

 

20002320

 

 

320

 

 

15

 

 

 

2500

 

 

23202700

 

 

И

 

 

 

 

 

 

 

 

380

 

 

16

 

 

 

2900

 

 

27003150

 

 

450

 

 

17

 

 

 

3400

 

 

 

У

Р

 

 

 

 

 

 

 

550

 

 

 

 

 

 

 

 

3150 3700

 

 

 

18

 

 

 

4000

 

 

37004400

 

 

700

 

 

19

 

 

 

4800

 

 

44005300

 

 

900

 

 

20

 

 

 

5800

 

 

Г

 

1100

 

 

 

 

 

 

 

53006400

 

 

 

 

21

 

 

 

7000

 

 

Б

 

 

1300

 

 

 

 

 

 

 

64007700

 

 

 

 

22

 

 

 

8500

 

 

77009500

 

 

1800

 

 

23

 

 

 

10500

 

 

950012000

 

2500

 

 

24

 

 

 

13500

 

а

 

 

3500

 

 

 

 

 

 

 

1200015500

 

 

 

25

 

 

 

19500

 

 

1550022500

 

7000

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 4. Идеализированный банк фильтров как упрощенная модель слуховой системы

Из та лицы

 

видно, что критическая

полоса не

соответствует диапазону с

ф кс рованными нижней и верхней границами. Ширина критической полосы остается

пр бл з тельно постоянной (около 100 Гц) вплоть до 500 Гц и увеличивается

приблизительнои

на 20% от центральной частоты при 500 Гц и выше:

 

Б

100 Гц,

f < 500 Гц,

(2)

BW ( f ) = 0,2 f Гц,

f 500 Гц.

 

 

 

 

Из (2) видно, что в частотной области до 500 Гц органы слуха воспринимают интенсивность звука, разделяя ее на участки постоянной абсолютной ширины, а свыше 500 Гц на участки постоянной относительной ширины. Для среднего слушателя ширина критической полосы слуховых фильтров (рис.5) может быть определена из выражения

BW ( f ) = 25 +75[1 +1,4( f /1000)2 ]0,69 .

(3)

Рис. 5 . Ширина критических полос как функцияУцентральнойИРчастоты

Из рис.5. видно, что по мере увеличения центральнойГчастоты критическая полоса расширяется. Поскольку имеет место однозначная зави-симость между частотой синусоидального колебания и высотой тона, то по аналогии с частотной группой слуха было введено понятие тональных групп слуха. Ширина тональной группы не зависит от высоты

тона и составляет 100 мел (один мел равен ощущаемой высоте звука частотой 1000 Гц при

соответствует изменению высоты в 1

 

оказалось.

 

 

 

 

уровне интенсивности 40 дБ), поэтому

 

удобным ввести единицу высоты тона в

одну тональную группу слуха. В честь немецкогоБфизика Г. Баркгаузена она носит название

 

 

 

 

 

 

барк

ритической полосы

или расстоянию

между

барк (1 барк = 100 мел), равная ширине

 

 

 

 

 

е

 

 

 

 

 

центральными частотами соседних

ритичес их полос. Переход от одной полосы к другой

 

Функция для перехода от частоты в Гц к частоте в барках (рис.6) опреде-ляется

где z(f) представляет с б йчастотуf в барках.

7500

 

 

соотношением

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

f

 

 

2

 

 

 

 

 

z( f ) =13arctg(0,00076 f ) +3,5arctg

 

,

(4)

 

 

 

и

 

 

 

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 6. Расстояние между центральными частотами критических полос

В основе приемов выделения в звуковом сигнале той части информации, которая четко воспринимается ухом, и удаления из сигнала всех остальных неслышимых деталей лежит эффект маскирования. Он связан с процессом взаимодействия сигналов, что приводит к изменению слуховой чувст-вительности к маскируемому сигналу в присутствии

маскирующего. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого сигнала и сигнала маскирования и могут быть разделены на две основные группы: частотное (одновременное) и временное (неодновременное) маскирования. Маскирование по частоте заключается в следующем: если два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного. Маскирование по времени определяет следующий эффект: более слабый сигнал становится неслышимым за 5 20 мс до включения сигнала маскирования и становится слышимым через 50 200 мс после его включения.

Маскирование непосредственно связано с нелинейностью слуха. Она проявляется в том, что при воздействии на барабанную перепонку достаточно громкого синусоидального звука с частотой f в слуховом аппарате формируются гармоники этого звука с частотами 2f, Зf и т.д. Поскольку в первичном воздействующем тоне этих гармоник нет, они получили

название субъективных гармоник.

 

Анализ кривых маскировки (кривых порога слышимости

при наличии маскировки)

показывает, что маскировка сигналов, имеющих частоту,

Р

лежащую ниже частоты

мешающего тона, проявляется значительно слабее чем вышележащихИчастот. Это дает основание предполагать, что маскирующее действие обусловлено возникновением

субъективных гармоник мешающего тона. Несмотря на то,Учто большую информацию об эффекте маскировки получают при исследованиях с тональными сигналами, при

использовании возникает ряд трудностей. Например, если два тона близки по частоте, то

между ними возникают биения.

 

 

 

Г

 

 

 

а

 

Если в качестве мешающего звука использовать узкополосный белый шум, пороги

слышимости определяются более четко,

 

с ми кривыеБполучаются более симметричными.

Это связано с

отсутствием

 

к

гармоничес их биений. Большой практический интерес

 

 

 

 

 

 

 

е

 

представляют кривые порога слышимости, полученные при маскировке широкополосными

шумами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

Б

 

Рис. 7. Кривые порога слышимости при маскировке белым шумом

 

 

 

На рис.7

приведены

кривые

порогов слышимости синусоидальных звуков,

полученные при маскировке белым шумом с различной спектральной плотностью. Из рис.7 видно, что на низких частотах кривые практически не зависят от частоты (примерно до 500 Гц). При дальнейшем увеличении частоты уровень порога слышимости повышается на 3 дБ при каждом удвоении частоты. Это примерно соответствует зависимости расширения ширины критических полос с увеличением центральной частоты (2). Из этого следует, что белый шум неодинаково эффективен для маскировки разных частот. Свойство широкополосных сигналов оказывать максимальное влияние на маскировку сигнала в

пределах критических полос положено в основу современных психоакустических алгоритмов сжатия сигналов.

Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот

(рис.8).

тональным сигналом определенной частоты Таким образом, для маскирования важнее не абсолютная громкость звуков, а

ИР Рис.8. Изменение порога чувствительности слуховой системы при маскировании

маскировки это разность в децибелах между уровнемГпорога слышимости маскируемого тона в присутствии маскера и его уровнем порога слышимости в тишине. На рис.8 показаны

отношение мощности громкого сигнала к мощности тихого. Кроме того, чем ближе частота к

частоте маскирующего сигнала, тем сильнее эффект маскированияУ

(см. рис.8). Степень

зависимость абсолютного порога чувствительностиБуха и характер его изменения в присутствии тона с частотой 1 кГц и мплитудой в 60 дБ. Из рис.8 видно, что порог

слышимости имеет адаптивный хара тер: он повыш ется при появлении каких-либо звуков и

понижается в тишине. Для того, чтобы

 

более слабые звуки на фоне более сильных,

 

 

 

 

 

 

 

услышать

их частоты должны значительно различаться.

 

 

Из рис.9 видно, что с ув лич никм средней частоты маскирующего сигнала диапазон

сторону высоких част т.

имеют

 

 

частот, где проявляется маскировка, становится шире. Кривые маскировки являются

несимметричными,

они

круеой спад

в сторону низких частот и пологий спад в

 

 

 

и

 

 

 

 

 

 

л

 

 

 

 

 

 

б

 

 

 

 

 

 

и

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

 

Рис.9. Изменение порога чувствительности слуховой системы при маскировании сигналами со средними частотами полос 0,25, 1, 4 и 8 кГц и уровнем интенсивности 60 дБ

Если при построении кривых маскировки по оси абсцисс откладывать не частоты ƒ, а значения высоты тона z в барках, то кривые маскировки при разных значениях z маскирующего сигнала будут одинаковыми при одном и том же значении уровня маскирующего сигнала (рис.10). Их форма при таком представлении будет зависеть только от маскирующего сигнала, и не будет зависеть от величины z.

Маскирование имеет место не только внутри критической полосы, оно распространяется и на соседние полосы. Маскер, центрированный в пределах критической полосы, оказывает определенное воздействие на порог обнаружения в соседних критических полосах. Функция протяженности маскирования, которая учитывает маскирование как внутри, так и между полосами, задается аналитическим выражением

SF (x) =15,81 + 7,5(x + 0,474) 17,5 1 + (x + 0,474)2 ,

(5)

где х и SF(x) представлены соответственно в барках и дБ.

 

Р

 

 

 

 

 

 

 

 

 

И

 

 

 

У

 

 

 

Г

 

 

 

 

Б

 

 

 

 

а

 

 

 

к

 

 

 

 

Рис.10. Частотное маскирование с частотной шкалой в барках

е

 

 

 

 

 

Вследствие разделения спектра звукового сигнала на частотные полосы

слух реагирует не на общую мощность сигнала, а на мощность,

сосредоточенную

в

тдельных частотных

группах. При этом

более

 

 

 

т

 

 

интенсивные част тные группы при определенных условиях могут маскировать

 

 

о

 

 

менее интенс вные группы. Применительно к сжатию это означает, что в

группах меньшейи

интенсивности допустим

больший уровень

шума

квантования, т.е.

допустимо уменьшение числа разрядов при кодировании

 

л

 

 

 

 

соответствующих спектральных составляющих, что в свою очередь снижает

скорость передаваемого цифрового потока.

 

 

 

б

 

 

 

 

 

Маскирование во временной области (рис.11) характеризует динамические свойства

слухаи, показывая изменение во времени относительного порога слышимости (порог

слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый

сигналы звучат не одновременно.

 

 

Б

 

 

 

 

 

Соседние файлы в предмете Электроакустика и звуковое вещание