
- •Глава 12. Цифровое представление звуковых сигналов
- •12.1. Аналого-цифровое преобразование
- •12.2. Равномерное квантование
- •12.3. Неравномерное квантование
- •12.4. Предыскажения при цифровой передаче сигналов звукового вещания
- •12.5. Цифро-аналоговое преобразование
- •12.6. Цифровая обработка звуковых сигналов
- •12.7. Достоверность цифровой передачи
- •12.8. Методы обнаружения и коррекции ошибок в цифровых звуковых сигналах
- •12.9. Кодирование с плавающей запятой
- •12.10. Редукция аудиоданных, обусловленная психоакустическими особенностями
- •12.11. Форматы цифровых сигналов и организация стыков цифровых трактов
- •12.12. Изменение частоты дискретизации
- •12.13. Структура цифрового сигнала в стандарте мреg-1 iso/iес 11172-3
- •12.14. Особенности стандарта mpeg–2 iso/iec 13818
- •12.15. Структура аудиоданных в стандарте мреg-2 iso/iec 13818-3
- •12.16. Обработка сигналов в среде мультимедиа
12.14. Особенности стандарта mpeg–2 iso/iec 13818
MPEG-2 Standart ISO/IEC 13818-3 (принят в марте 1994 г.) расширяет и дополняет MPEG-1 Standart ISO/IEC 11172-3 до возможности формирования в едином цифровом потоке пяти отдельных звуковых каналов и дополнительно канала сверхнизких частот (LFE – Low Frequence Enhancement) с высоким качеством и низкой суммарной скоростью их передачи. Тем самым становится возможным передать в цифровой форме по каналам связи, записать и воспроизвести в помещении прослушивания (комната радиослушателя, видеозал, кинотеатр и т.п.) всю совокупность конфигураций форматов воспроизведения, предусмотренных Документом 10/63Е ITU-R (см. разд. 9.16 и табл. 9.5).
В MPEG-2 стандарте может быть организована передача любой конфигурации ЗС: 3/2, 3/1, 3/0, 2/2, 2/1, 2/0, 1/0, а также общего канала сверхнизких частот с полосой до 150 Гц (система звукопередачи 5+1). Напомним, что сформированный в ТФП пятиканальный ЗС перед кодированием подвергается матрицированию с целью выполнения требований совместимости и лишь после этого цифровой обработке для сокращения избыточности. Для компактного цифрового представления ЗС в данном случае используется метод кодирования MUSICAM, но в отличие от MPEG-1 в этом новом стандарте расширен состав применяемых кодеков и используемых частот дискретизации: 16, 22,05 и 24 кГц (дополнительно к ранее предусмотренным значениям: 32, 44,1 и 48 кГц). Стандарт MPEG-2 позволяет передавать одновременно: стереофонические сигналы в двух конфигурациях (3/0 и 2/0); стереофоническое звучание и дополнительно речь на двух языках; моносигнал и дополнительно до семи комментаторских каналов с более низким качеством, используя дополнительные частоты дискретизации 16, 22,05 и 24 кГц. В этом новом формате декодер ISO/IEC 11172-3 (MPEG-1) может восстанавливать два канала без дополнительной многоканальной части, а декодер MPEG-1 ISO/IEC 13818–3 расшифровывать поток данных формата 111723, как устройство более высокой иерархии.
Итак, для пары основных сигналов стереопары Л = Т0 и П = Т1 выполнено требование как прямой, так и обратной совместимости при декодировании (рис. 12.38).
Алгоритм декодирования дополнительных сигналов многоканального расширения Т2, Т3, T4, иной, достаточно гибкий, ориентированный на максимально допустимое сокращение скорости цифрового потока при их передаче. Кроме того, длина фрейма в MPEG-2 составляет 48 мс вместо 24, поэтому для распознавания нового формата ID-бит в MPEG-1 принимает значение 0 (см. разд. 12.14).
В
зависимости от вида кодирования декодер
MPEG-2 ISO/IEC 13818-3 может декодировать либо
чистую стереоинформацию [сигналы Л и
П, см. (9.48)] или смесь сигналов нескольких
каналов.
Заметим, что пространственные сигналы LS и RS имеют полосу частот 100... 7000 Гц, как это принято в системе " Dolby-Surround ", Полоса частот сигнала С ограничивается значением 9 кГц, лишь два сигнала L и R имеют полную полосу частот.
Матрица кодирования и декодирования исходного пятиканального сигнала МРЕG-2 стандарта представлена на рис. 12.39. На передающей стороне системы звукопередачи исходный пятиканальный сигнал преобразуется в новую совокупность в соответствии со следующим алгоритмом (это преобразование выполняется для того, чтобы удовлетворить требованию совместимости, см. гл. 9):
То = Л = L + С + LS,
T1 = П = R + С + RS, (12.49)
Т2=С,
Т3 = LS,
Т4 = RS,
где , , – постоянные коэффициенты, которые могут иметь различные значения (табл. 12.1) в зависимости от режима работы.
Последняя строка в этой таблице соответствует режиму работы, когда исходная совокупность сигналов без матрицирования прямо доводится до пользователя. Далее, чтобы избежать возможной перегрузки уровни сигналов Т0, T1, Т2, Т3, Т4 при передаче понижаются на значение а. Режим 2 соответствует передаче сигналов системы «Dolby-Surround», поэтому при их дематрицировании для выделения пространственных сигналов должен выполняться поворот фазы сигналов Л и П соответственно на ±90°.
На рис. 12.40 изображена в упрощенном виде структура МРЕG-2 кодера для многоканальной звукопередачи. Исходными здесь являются входные сигналы LS,L,C,R,RS. Сигнал С центрального фронтального канала ограничивается по полосе сверху значением 9 кГц, а его более высокочастотные компоненты распределяются на левый L и правый R фронтальные каналы.
Режим |
Коэффициенты матрицирования |
||
|
|
|
|
0 1 2 3 |
1/(1+2) 1/(1.5+0,5х2) 1/(1+2) 1 |
1/2 1/2 1/2 1 |
1/2 (см. рис. 12.41) 1/2 (см. рис. 12.41) 1/2 (для сигналов Л и П сдвиг по фазе ±90°) 1 (без матрицирования) |
Все исходные сигналы анализируются с учетом психоакустической модели. Кроме того, с помощью банка фильтров, как и ранее в МРЕG-1 стандарте, каждый из сигналов разделяется на 32 полосные составляющие, а затем дискретизируется с различной частотой дискретизации, но кратной системной тактовой частоте fs.
Сигналы С, LS, RS дополнительных каналов квантуются до кодирования, чтобы уменьшить ошибки при их матрицировании. Далее все сигналы "взвешиваются" (, , ), после чего поступают на сумматоры (+) для получения совместимых сигналов обычной стереофонии Л = Т0 и П = Т1. Эта основная пара сигналов дополняется тремя дополнительными сигналами T2, Т3, Т4, которые должны по возможности иметь при передаче как можно меньший суммарный поток аудиоданных.
В МРЕG-2 стандарте для получения максимально возможной компрессии общего цифрового потока при кодировании дополнительного многоканального расширения (сигналы Т2, Т3, Т4 учитываются также и степень корреляции между основными Т0, Т1 и дополнительными T2, Т3, Т4.) сигналами. Если корреляция сильная, то от передачи данных по дополнительным каналам можно отказаться и передавать лишь различия по отношению к сигналам основных каналов. Для этой цели служит адаптивное предсказание, которое используется в МРЕG–2 кодере при передаче дополнительных сигналов. Более того, сам состав передаваемых сигналов в дополнительных каналах не постоянен.
Возможны следующие восемь их комбинаций с соответствующим переключением в кодере:
Т0 Т1 Т2 Т3 T4
Л П С LS RS
Л П L LS RS
Л П R LS RS
Л П С L RS
Л П С LS R
Л П С L R
Л П R L RS
Для уменьшения скорости передачи данных в МРЕG-1 предусматривается режим "Joint-Stereo" ("объединенное стерео"), в котором для области верхних частот в левом и правом каналах передаются только коэффициенты масштаба, сами же сигналы этой области остаются монофоническими. При более двух передаваемых сигналах можно исходить из того, что не каждый из них одновременно нуждается в максимальном потоке данных при его передаче. Для восприятия ЗС не требуется полная передача всей информации в каждом из них. Как правило, вся необходимая для полноценного восприятия информация в текущий момент времени содержится не более чем в двух-трех сигналах, остальные же из них в этот момент времени являются как бы "фоновым дополнением". Например, если в текущий момент явно ощущается какое-то приоритетное направление в пеленгации КИЗ, то значительная доля информации в паре сигналов, определяющих его восприятие, идентична. В этой связи в МРЕG-2 стандарте предусматривается значительно более гибкий метод для компрессии общего потока данных – так называемое динамическое переходное затухание между каналами, что позволяет экономить значительное число бит при передаче.
Таблица 12.2
Номер группы полосных сигналов |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
Номер полосной составляющей исходного сигнала |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8, 9 |
10, 11 |
12-15 |
16-31 |
Для одного, двух или трех каналов передаются, как и при режиме "Joint-Stereo", лишь коэффициенты масштабирования, с помощью которых после декодирования меняется лишь соотношение уровней данной группы сигналов, остающихся одинаковыми по структуре (монофоническими, точнее говоря изоморфными).
Иначе говоря, все значения отсчетов для таких групп частотных полос остаются общими и одинаковыми, кроме значения уровня. Одинаковыми и общими после декодирования являются и сами эти сигналы, наблюдаются лишь отличия в их уровне, необходимые для пеленгации (локализации) источника звука. В этой ситуации требуется лишь передать коэффициенты масштаба, а сами значения отсчетов восстанавливаемого сигнала берутся из другого канала. Таким образом, корреляция сигналов различных каналов используется здесь для дополнительной компрессии данных.
И еще одно замечание – при передаче многоканального расширения субполосные сигналы объединяются в 12 групп (табл. 12.2) для их последующего анализа и обработки с целью управления значением динамического переходного затухания между каналами многоканального расширения. В выходной части кодера все множество разделенных цифровых данных форматируется в соответствии с определенными правилами в единый цифровой поток.
Изложенное позволяет говорить о существенном отличии алгоритма обработки сигналов многоканального расширения в кодере MPEG-2 по сравнению с MPEG-1. Это отличие базируется на еще более тонком учете как структуры многоканального сигнала, так и свойств слуха при его восприятии, и преследует только одну цель – обеспечить максимально возможное сокращение избыточности передаваемой информации, а значит, и уменьшение скорости цифрового потока при его передаче.
На рис. 12.41 изображена упрощенная структурная схема MPEG-2 декодера. Входной цифровой поток данных разделяется во входной части устройства на сигнальные и управляющие составляющие, а затем восстанавливаются первоначальные значения отсчетов ЗС. Декодированные ЗС подвергаются обратному преобразованию в матрице в каждой из 32 полос. И наконец, различные полосные составляющие каждого из сигналов вновь объединяются в инверсном банке фильтров. На выходе декодера получается исходная совокупность восстановленных сигналов Л, П' и LS', L', С', R', RS'.