Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Boriskevich_anali.pdf
Скачиваний:
0
Добавлен:
13.05.2026
Размер:
592.22 Кб
Скачать

Рис. 11. Зависимость изменения порога слышимости маскируемого сигнала от

величины временного интервала между сигналом и маскером

Считается, что за это время завершается полная обработкаГУсигналаИс выделением всех его признаков. В этом случае слуховую систему можно рассматривать как процессор для обработки звуковых сигналов во временном окне шириной примерно 200 мс.

Различают предмаскировку

(маскируемый сигнал перед маскером) и послемаскировку

(маскируемый сигнал после

маскера). Оба вида маскировки наступают,Ресли маскируемый

сигнал и маскер одновременно находятся во временном окне шириной 100200 мс.

интервале, причем ее длительность в очень сильнойБстепени зависит от опыта слушателя. Степень маскирования звукового сигн ла з висит от интервала между маскируемым

Из рис.11 видно, что длительность типичных промежутков времени, в пределах которых действуют предмаскирование и послемаскирование, состав-ляет соответственно 5

50 мс и 50 200 мс. Предмаскировка проявляется на значительно более коротком временном

сигналом и маскером, уровня интенсивности и длительности воздействия маскера.

Сближение во времени подачи сигнала маскераи

увеличивает маскировку. Временное

 

 

 

к

 

 

 

е

 

маскирование зависит от частотного взаимоотношения сигнала и маскера точно так же, как и

 

 

т

 

 

при частотном маскировании. Оно проявится в большей степени, если сигнал и маскер

близки по частоте.

о

 

 

 

2.3. Психоакустическая модель слуховой системы

и

 

 

 

Алгоритм раб ты псих акустической модели слуховой системы предназ-начен для

вычисления г оба ьных маскирующих порогов и отношения сигнал/маска и состоит из

следующих этапов.

1. Спектральный анализ и нормализация уровня звукового давления сигнала. Вы орки (отсчеты) входного аудиосигнала s(n) нормализуются по

формуле

 

 

 

 

б

 

s(n)

 

 

и

x(n) =

,

(6)

N (2b1 )

Бгде N – количество отсчетов или длина окна анализа сигнала; b – количество разрядов или ступеней квантования на выборку; n – индекс выборки входного сигнала.

Нормализованный сигнал x(n) , используя оконную функцию Ханна с 1/16 долей

перекрытия, разбивается на блоки, содержащие 512 выборок входного сигнала.

Оценка спектральной плотности мощности P(k) в дБ с использованием 512точечного быстрого преобразования Фурье производится по формуле

 

N 1

j

2πkn

 

 

2

 

N

 

 

 

 

 

 

 

P(k) = PN +10log10

w(n)x(n)e

N

 

 

при 0 k

,

(7)

 

 

 

 

 

2

 

n =0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где PN уровень нормализации мощности сигнала, равный 90 дБ; k – индекс спектральной составляющей интервала разрешения (бина);

w(n) =

1

 

 

2πn

 

 

1

cos

 

 

 

оконная функция Ханна.

 

 

 

2

 

 

N

 

 

 

 

 

 

 

 

Поскольку уровни воспроизведения сигнала неизвестны в момент проведения

психоакустического анализа сигнала, процедура нормализации (6) и параметр

PN в (7)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р

 

 

используются для оценки уровня звукового давления независимо от входного сигнала.

 

 

 

2.

 

Идентификация

тональных

и шумовых маскеров. Локальные

максимумы

в

спектральной

плотности мощности P(k) ,

которые

превышают

И

компоненты

в

 

соседние

пределах

одного

барка по крайней

мере

на 7

дБ,

идентифицируются

как

тональные.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У

 

 

 

Множество тональных спектральных максимумов ST

определяется следующим выражением:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ST

 

 

 

 

 

P(k) >

P(k

±1),

 

 

 

 

(8)

 

 

 

 

 

 

 

 

 

 

 

 

=

P(k)

P(k)

>

P(k ± k ) + 7dB

,

 

где P(k)

к локальный спектральный максимум;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

при

 

2 < k < 63

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(0.17 5.5 кГц),

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

при

63 k <127

(5.5 11 кГц), Б

 

 

 

 

 

 

 

 

[2,3]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[2,6]

при

127 k 256 (11

20

 

Гц).

 

 

 

 

 

 

 

 

 

 

 

максимумов множества (8) по

формуле

PTM (k)

в

дБ

 

вычисляются из

спектральных

 

 

Значения

тональных

маск ров

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

PTM (k) =10 log10

100,1P(k + j) ,

 

 

 

 

(9)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

P(k 1)

 

 

P(k +1) -

значения

 

спектральной

плотности

 

мощности

частотных

составляющих, соседн х с P(k) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пос е идентификации тональных маскеров значение спектральной плотности

мощности

PNM (k

) в дБ единственного шумового маскера для каждой критической полосы

вычисляется

 

 

 

 

 

 

 

PNM

(k ) =10 log10 10

0,1P( j)

 

 

 

за

(10)

 

 

 

 

лиз оставшихся

спектральных

 

 

составляющих, находящихся

пределами

д апазона тонального маскера ±k , по формуле

 

 

 

 

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(k,k ±1,k ±)},

 

 

 

 

 

 

u

1/ (lu+1)

 

 

 

 

 

 

для

 

всех

P( j) {P

 

 

где

 

 

=

 

j

 

 

 

средняя

геометрическая

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

TM

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

 

спектральная составляющая критической полосы; l и u нижняя и верхняя границы спектральных составляющих критической полосы соответственно.

3. Прореживание и преобразование маскеров. На этом шаге количество маскеров сокращается на основе двух критериев: абсолютного порога слышимости и частотного прореживания. Тональные и шумовые маскеры, расположенные ниже абсолютного порога слышимости, отбрасываются, а остаются лишь маскеры, удовлетворяющие условию

PTM , NM (k) Tq (k) ,

(11)

где Tq (k) уровень звукового давления абсолютного порога слышимости в тишине для k

спектральной составляющей.

Процедура скользящего окна шириной 0,5 барка используется для замены любой пары маскеров, появляющихся в пределах данного окна, одним маскером с наибольшей мощностью. После выполнения данной процедуры частотные бины (интервалы разрешения) маскеров преобразуются согласно схеме субдискретизации

 

 

 

PTM ,NM (i) = PTM ,NM (k) ,

 

 

Р

(12)

 

 

 

PTM ,NM (k) = 0 ,

 

У

(13)

 

 

 

 

 

 

 

 

 

 

k

 

при

1 k 48,

Г

И

 

где i =

 

+(k mod 2)

при 49 k 96,

 

 

 

 

(14)

k

 

 

 

 

 

 

+3 ((k 1) mod 4)

при 97 k 232.

 

 

 

 

 

 

k

 

 

 

 

 

Согласно (14), эффект прореживания бинов маскеров в критических полосах 1822

слуховой системы составляет 2:1, а

 

а

 

 

 

 

 

для критических полос 2225 он равен 4:1 без потерь

маскирующих компонент. Данная процедура уменьшаетБ

общее число частотных

бинов

тональных и шумовых маскеров от 256 до 106. Результатом выполнения данного этапа

 

 

 

ктральные

 

 

 

 

 

 

является прореженное множество тональных и шумовых маскеров.

 

 

 

Данный этап удаляет сп

 

 

омпоненты, которые присутствуют обычно ниже

порога слышимости в тишине, и болкслабые тональные компоненты, находящиеся в

пределах

 

т

 

 

 

барка) сильного тонального

половины ширины

критич ской полосы (0,5

компонента. Данная модель

использует прореженные тональные и нетональные (шумовые)

компоненты для

определения

глобального порога маскирования в частотной области.

 

 

4. Вычисление индивидуальных порогов маскирования. Каждый инди-видуальный

и

 

 

порог характер зует маскирующий вклад в i-й частотный бин тонального или шумового

маскера, расположенн го в j-м бине, преобразованном на этапе 3. Индивидуальные пороги

 

 

л

TTM (i, j) вычисляются по формуле

 

тонального маскера

 

 

TMб

TTM (i, j) = PTM ( j) 0,275z( j) + SF(i, j) 6,025 ,

(15)

и

 

 

 

где

P ( j) уровень звукового давления тонального маскера в дБ в j частотном бине;

z( j)

частота j-го бина в барках; SF (i, j) функция распространения маскирования от j-го

бина маскера к i-му бину маскируемого сигнала.

 

 

Функция распространения маскирования SF (i, j) в дБ от j-го бина маскера к i-му

Ббину маскируемого сигнала моделируется в виде кусочно-линейной функции уровня маскера

P( j) по формуле

Соседние файлы в предмете Электроакустика и звуковое вещание