Добавил:

chrysler_a57_mltbnk Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский технический университет связи и информатики

Предмет:

Формирование и первичная обработка звуковых и видео сигналов

Файл:

лаба_3_3_фипоз_метода

.pdf

Скачиваний:

Добавлен:

13.05.2026

Размер:

915.9 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

56	Цифровая обработка сигналов в трактах звукового вещания

значения сопряженной функции f~T(t) определятся значениями f(t) на конечном отрезке времени – в отличие от идеального случая, когда значения f~(t) зависят от значений f(t) на всей временной оси. Идеальное ПГ с конечной памятью определяется сверткой

f ~T t f t	1		T		T
		, t		;		.	(2.6)
	t		2		2

Импульсная характеристика такого преобразователя Гильберта

hT t h t w t ,

(2.7)

где w(t) – функция окна прямоугольной формы. В частотной области hT(t) будет соответствовать свертка

HT j H j		W j ,		(2.8)
		T
	sin
где W j			.	(2.9)
	T

Из-за разрыва второго рода импульсной характеристики в начале координат идеальное ПГ с конечной памятью также физически нереализуемо, поскольку такой преобразователь должен иметь бесконечную полосу пропускания и неограниченную пропускную способность. Физически реализуемую форму ПГ с конечной памятью можно получить в виде свертки сигнала с импульсной характеристикой вида:

t О (

T1,T1)

пп

signt,

pT1

hT (t)=

(

)

(

)

T2,

T1,T2

(2.10)

, t О

п pt

0, t О ( Ґ , T2 )И (T2,Ґ ).

оп

Величина Т1 определяет погрешность преобразования в области ВЧ, а Т2 – в области НЧ. Погрешность приближения ПГ может определяться как во временной, так и в частотной области. В [4] критерием точности преобразования служит неравномерность его АЧХ. Используются две среднеквадратические относительные оценки: бесконечная и конечная. Среднеквадратическая бесконечная погрешность определяется как корень квадратный из отношения энергии абсолютной погрешности к энергии f~(t), причем энергия определяется на всей временной оси

2. Некоторые математические процедуры анализа звуковых сигналов											57
			f ~				t f ~ t 2 dt
			f ~		T		t f ~ t 2 dt
					T

										.	(2.11)
						f ~ t 2 dt				.	(2.11)
						f ~ t 2 dt


Среднеквадратическая								конечная погрешность представляется
аналогично, но на конечном интервале Т
	T
	2		[f ~T (t) f ~ (t)]2 dt
	T
		2							.		(2.12)
				T					.		(2.12)
				T
				2		[f ~ (t)]2 dt
				T
				2

Поскольку при обработке сигнала обычно интересуются им на конечном интервале времени, то из двух среднеквадратических оценок больший практический интерес представляет конечная оценка, определяемая соотношением (2.12).

ПГ позволяют дать строгое определение огибающей и фазы сигнала

A t		f2 t + f ~2			t ,	(2.13)
t	arctg		f ~ t	.		(2.14 а)
t	arctg			.		(2.14 а)
			f t
При этом
f t A t cos t					и f ~ t A t sin t .	(2.14 б)
Вещественные колебания вида
f t a t cos t						(2.15)

часто представляют комплексными функциями, формально заменяя cosφ(t) на ejφ(t). При этом неявно утверждается, что амплитуда коле-

бания есть a(t), а сопряженный сигнал – f(t) a(t) sin (t) , в отличие

от сопряженного по Гильберту f~(t). Сигналы f(t) и f(t) имеют неравные амплитудные и энергетические спектры, поэтому комплексный сигнал f t f t j f t , в общем случае, не будет аналитическим.

58	Цифровая обработка сигналов в трактах звукового вещания

Тем не менее, формальное представление (2.15) конкурирует с представлением (2.14 б) [4].

2.2.3.О погрешности синтеза ортогонального сигнала на базе преобразования Гильберта

Для реализации модуляционного представления ЗВС необходимо ортогональное преобразование. Требования к точности ортогонального преобразования могут быть сформированы на основании известных данных о заметности модуляций звуковых сигналов [51]. На рис. 2.4 приведены графики пороговых чувствительностей слухового анализатора к амплитудной модуляции при различной глубине модуляции m из [51]. А на рис. 2.5 – к частотной модуляции (ЧМ) при различных индексах модуляции и модулирующей частоте 4 Гц. На основании данных этих графиков построены графики зависимостей


относительных изменений модулирующих				функций: огибающей
( A	Aпорог	) и мгновенной частоты (	порог		) – от частоты ос-

	A

новного колебания, соответствующие пороговым чувствительностям слухового анализатора при уровне прослушивания 80 дБ. Графики приведены на рис. 2.6. Отсюда, в частности, видно, что пороговая чувствительность слухового анализатора к относительным изменениям частоты колебания существенно выше, чем к относительным изменениям его амплитуды.

Рис. 2.4. Кривые порогов чувстви-	Рис. 2.5. Кривые пороговых значений
тельности к АМ при различной	индекса модуляции при ЧМ. Моду-
глубине модуляции m	лирующая частота 4 Гц

2. Некоторые математические процедуры анализа звуковых сигналов

Рис. 2.6. Относительные изменения	Рис. 2.7. ОСШ для ортогонального
модулирующих функций, соответст-	сигнала, соответствующие порого-
вующие пороговым чувствительно-	вым заметностям в изменении
стям слухового анализатора при	модулирующих функций
уровне прослушивания 80 дБ

Поскольку и огибающая, и мгновенная частота – нелинейные функции ортогонального сигнала, а интервал их определения достаточно велик, использование метода линеаризации для аналитического вычисления допустимой погрешности синтеза ортогонального сигнала не представляется целесообразным. Поэтому предельные погрешности синтеза ортогонального сигнала были определены путем компьютерного моделирования. К тестовому колебанию, синтезированному с заданной частотой и амплитудой, аддитивно подмешивался белый шум, так, чтобы обеспечивалось определенное отношение сигнал–шум (ОСШ). Затем определялись соответствующие этому ОСШ относительные среднеквадратические отклонения

(ОСКО) вычисленных модулирующих функций от их заданных значений в тестовом сигнале. ОСКО на выборке в N отсчетов определялось в соответствии с формулой (2.13) для дискретного сигнала:

	N-1		2
			2
		(xi - xi	)
ОСКО	i 0			,	(2.16)
ОСКО	N-1(xi )2			,	(2.16)
	N-1(xi )2

i 0

где xi , xi – отсчеты сигнала и его оценки, соответственно. В соответствии с графиками на рис. 2.5 выбирались значения ОСШ, соот-

60	Цифровая обработка сигналов в трактах звукового вещания

ветствующие пороговой заметности модуляций на слух. Результаты приведены на рис. 2.7. Из графиков видно, что требования к точности ортогонального преобразования существенно выше, если необходимо работать с мгновенной частотой, а не с огибающей сигнала.

2.2.4.О точности формирования ортогонального сигнала на основе БПФ

По критериям простоты вычислительных операций и скорости вычислений был выбран алгоритм преобразования в частотной области с использованием БПФ на основе формулы (2.2):

			j,	k (0,N 1)
X ~ X	H ,	H				2	.	(2.17)
X ~ X	H ,	H			N	2	.	(2.17)
k	k k	k		k (	N	,N 1)
			j,	k (	2	,N 1)
					2

В этой формуле Xk – коэффициенты БПФ-отсчетов исходного сигнала, X~k – коэффициенты ортогонального сигнала, последовательность Hk – можно интерпретировать как дискретное представление функции jsign(ω). В этом случае для достижения высокой точности необходимо минимизировать просачивание энергии спектральных компонентов сигнала в соседние коэффициенты БПФ путем наложения оконных функций. Очевидно, что чем ниже уровень боковых лепестков функции окна в частотной области, тем выше точность преобразования. Однако уменьшение боковых лепестков сопровождается увеличением ширины основного лепестка.

Поскольку коэффициенты реальной и сопряженной частей спектра изменяются по фазе в противоположные стороны, наибольшим искажениям будут подвергаться сигналы, отображаемые первыми и последними коэффициентами БПФ. Для выбора функции окна можно воспользоваться данными, приведенными в [50]. Наименьшим уровнем боковых лепестков, из приведенных функций, обладает окно Наттолла (или минимальное четырехчленное Блэкмана–Хэрриса). Для оценки искажений на первых и последних коэффициентах дополнительно был произведен анализ параметров оконных функций в частотной области. Для этих коэффициентов вычислялось отношение Rk:

N 1 2 Ei

R	k	i 1	,
R		N 1	,


		2 Ei
		i k 1

2. Некоторые математические процедуры анализа звуковых сигналов

где Ei – энергия i-го коэффициента; k – номер коэффициента, к спектральной энергии выше которого относилась энергия всех коэффициентов. Данное отношение определяет максимальную теоретическую погрешность синтеза ортогонального сигнала для гармонического колебания, отображаемого k-м коэффициентом, обусловленную свойствами окна.

На рис. 2.8 приведены гра-
фики Rk	для четырех окон: Нат-
толла, Хемминга, треугольного и
прямоугольного, – промежуточ-
ные точки (соответствующие до-
лям бина) получены интерполя-
цией. (Для последних коэффи-
циентов реальной части спектра
графики	будут аналогичными.)
Окно Наттолла уступает в за-
щитном отношении сигнал–шум
другим окнам до 3-го коэффици-
ента и значительно превосходит
их на коэффициентах больших
номеров. На 4-м коэффициенте		Рис. 2.8. Отношение Rk для четырех
значение Rk достигает величины		оконных функций
приблизительно 85,7 дБ и далее

почти не изменяется.

На рис. 2.9 представлены иллюстрация использования оконной функции для перекрывающихся последовательностей, сглаженных окном (а), и схема алгоритма синтеза ортогонального сигнала (б). Точки с и d соответствуют входу и выходу из алгоритма, причем внутри блока – между точками k и l – может быть произвольное требуемое преобразование сигнала.

На рис. 2.10 представлены погрешности синтеза (отношение сигнал-шум преобразования ОСШп) ортогонального сигнала для гармонического колебания, частота которого соответствовала заданным коэффициентам БПФ.

Из рисунка видно, что ОСШп в пределах бина меняется, достигая минимума меджу бинами. Минимальное ОСШп реализуется на крайних коэффициентах, что ограничивает возможности использования такого способа преобразования в области низких и высоких частот, где зависимости аналогичны. При использовании в практических приложениях, например для обработки ЗВС, необходимо увеличивать длину выборки, а часть коэффициентов – отбрасывать. Данные рис. 2.10 получены при использовании окна Наттолла на длительности 8000 точек. Заметим, что поскольку это окно при перекрытии 50% не

62	Цифровая обработка сигналов в трактах звукового вещания

обеспечивает единичного коэффициента передачи, необходимо введение коффициента передачи, необходимо введение компенсирующей функции (см. рис. 2.9, б).

Рис. 2.10. Схема алгоритма синтеза ортогонального сигнала

2. Некоторые математические процедуры анализа звуковых сигналов							63
ОСШ,дБ
160
140
120
100
80
60
40
20
0
0,1	0,3	0,5	0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3 2,5 2,7 2,9 3,1 3,3 3,5 3,7 3,9 4,1 4,3 4,5 4,7 4,9 5,1 5,3	5,5	5,7	5,9	К, бин
			Рис. 2.10. Погрешности синтеза ортогонального сигнала
			для гармонического колебания

2.3.Фильтрация на основе нелинейного транспонирования спектра комплексного сигнала

Сформулированным выше (разд. 2.1.1) требованиям не отвечает ни один из существующих способов представления звукового сигнала в частотной области, что делает необходимым дальнейшее совершенствование алгоритмов формирования субполосного представления. Одно из направлений таких работ представлено в [12].

Разрешить противоречие между качеством фильтрации и скоростью перестройки параметров при приемлемой вычислительной сложности можно с помощью фильтрации, основанной на нелинейном транспонировании спектра комплексного сигнала и последовательном его ограничении сверху и снизу стационарными фильтрами на основе БПФ (см. Приложение).

Спектр аналитического сигнала s(t) s(t) js ~ (t) , где s(t) – исходный действительный сигнал, а s ~ (t) = H{s(t)} – его ортогональ-

ный сигнал (иначе трансформанта Гильберта) расположен в области только положительных частот, это делает более удобным реализацию ограничивающих фильтров. Умножением на комплекс-

		t	f1		в каждый момент спектр
ную экспоненту e1	t exp j		f1	d	в каждый момент спектр

64	Цифровая обработка сигналов в трактах звукового вещания

сигнала смещается по оси частот на величину, определяемую значением функции f1(t). Полученный сигнал s1(t) является комплексной

модулирующей функцией сигнала e1 t . Спектр сигнала s1(t) про-

пускается через стационарный ФВЧ и ограничивается (в частотной области) снизу. Полученный сигнал снова смещается умножением

		t	f2		– результатом
на комплексную экспоненту e2	t exp	j	f2	d	– результатом

является сигнал s2(t) , который ограничивается сверху стационарным ФНЧ. Фильтрованному сигналу s2(t) возвращается положение на оси частот исходного сигнала s(t) умножением на произведение

e1 t e2 t (функций комплексно сопряженных e1 t и e2 t ). Функции f1 t и f2 t являются параметрами фильтра, определяющими

его «гибкость», т.е. скорость перестройки его центральной частоты и ширины полосы пропускания. В качестве f1 t и f2 t могут быть

выбраны функции, зависящие от сигнала s(t) . В этом случае легко

реализуется адаптивная к сигналу фильтрация, а качество фильтрации определяется характеристиками стационарных фильтров.

Таким образом, разделением функций адаптации к сигналу и фильтрации снимается противоречие между требуемой разрешающей способностью фильтра и скоростью его перестройки, а разнесением во времени операций фильтрации сверху и снизу достигается «подвижность» ширины полосы пропускания. При цифровой реализации такой фильтрации преобразование Гильберта заменяется

конечным дискретным преобразованием Гильберта s ~ (n)= = H{s(n)} , и транспонирование спектра производится умножением отсчетов исходного комплексного сигнала на отсчеты комплексных

		N 1					N 1		. При этом
экспонент e1	n exp	j f1	i	и e2	n exp		j f2	i	. При этом
		i 0					i 0
появляются	ограничения на		функции			смещения по		частоте f1(k)

и f2(k), значения которых не могут превышать половины значения частоты дискретизации.

Удобно в качестве граничных частот ФВЧ и ФНЧ выбрать «ноль» частотной оси, в этом случае ограничивающая фильтрация сводится к разделению спектров положительных и отрицательных частот,

2. Некоторые математические процедуры анализа звуковых сигналов

и в каждый момент центральная частота фильтра равна f1 k f22(k) ,

а ширина полосы – f2(k).

Эффективность данного способа фильтрации может быть оценена по степени концентрации «полезной» энергии сигнала в полосе пропускания. Такая оценка была произведена с помощью тестового сигнала, составленного из суммы «полезного» и «мешающего» компонентов (частота дискретизации сигнала 44,1 кГц, разрядность представления 16 бит). Полезный сигнал был составлен из двух синусоид с линейно нарастающими с разными скоростями мгновенными частотами. Мешающий сигнал был образован так же, но мгновенные частоты его компонентов отличались от мгновенных частот составляющих полезного сигнала на постоянные величины.

Тестовый сигнал пропускался через фильтр, временные параметры которого f1(k) и f2(k) в каждый момент k имели одинаковое отклонение (30 Гц) от траекторий мгновенных частот компонентов полезного и мешающего сигналов. На рис. 2.11 схематично представлены графики мгновенных частот тестового сигнала и траектории параметров f1(k) и f2(k).

Для оценки качества разделения фильтром полезных и мешаю-

щих компонентов вычислялось относительное среднеквадратиче-

ское отклонение (2.16) фильтрованного сигнала от полезных компонентов исходного.

Рис. 2.11. Схема изменения мгновенных частот тестовых сигналов

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

Соседние файлы в папке лаба 3

#
13.05.20261.56 Mб000_лаба_3_3_фипоз_отчёт.docx
#
13.05.2026533.46 Кб000_лаба_3_3_фипоз_отчёт.pdf
#
13.05.2026915.9 Кб0лаба_3_3_фипоз_метода.pdf