20. Принципы перцептуального кодирования звука.
Кодирование звука с устранением психоакустической избыточности называют перцептуальным кодированием. Оно основано на использовании т.н. границы маскирования. Звуки, уровень которых лежит ниже этой границы, считаются принципиально неслышимыми человеческим ухом и либо игнорируются, «выбрасываются», либо кодируются с меньшей разрядностью, чем основной звуковой поток.
Перцептуальное кодирование использует свойства человеческого слуха для такого распределения имеющихся бит, чтобы они использовались для хранения звуков, которые мы можем слышать, и не расходовались на кодирование звуковых частот, выходящих за границы воспринимаемого нашим слухом. Например, психоакустический эффект маскирования не позволяет нам слышать тихие звуки в присутствии более громких, близких по частоте. Поскольку музыка кодируется столь малым количеством бит, перцептуальное кодирование вносит сильные шумы и погрешности в звуковой сигнал. Но с этими шумами и искажениями проводятся искусные манипуляции, благодаря которым они оказываются ниже порога маскирования, — при этом их не слышно. Например, если большая часть энергии музыкального сигнала сосредоточена в данный момент между частотами 1 кГц и 3 кГц, шум также будет сконцентрирован в этой полосе частот. Спектр шума постоянно смещается таким образом, чтобы шум оказывался "спрятанным" за звуковым сигналом. Частотные полосы с большим количеством информации занимают большое число бит, полосы с малым количеством информации — меньшее число бит.
21. Стандарты кодирования mpeg Audio. Общая характеристика.
Группа стандартизации ISO/IEC JTC1/SC29/WG11, известная также как группа MPEG (Moving Picture Expert Group), была сформирована по инициативе Международной организации по Стандартизации ISO (International Standards Organization) и Международной Электротехнической Комиссии IEC (International Electrotechnical Commission) в 1988 году. Целью создания группы была разработка стандартов на схемы цифрового кодирования изображения и звука, обеспечивающих пониженные скорости передачи кодированных данных. В ноябре 1992 года группа MPEG разработала свой первый стандарт на систему передачи звука и изображения MPEG1 [22]. Кодирование звука по стандарту MPEG1 предусматривало только одноканальный или двухканальный стереорежимы с частотами дискретизации 32, 44,1 и 48 кГц [23]. Уровень 2 стандарта MPEG1 обеспечивал очень высокое качество звучания при скорости потока данных в каждом канале 128 кбит/сек [24, 25].
На следующем этапе целью группы MPEG стала подготовка требований к многоканальному расширению стандарта MPEG1 Audio, которое обеспечивало бы обратную совместимость с уже существующими системами MPEG1 - MPEG2 ВС (где ВС - это «Backward Compatible», то есть «обратная совместимость») и определение стандарта кодирования с более низкими частотами дискретизации (16, 22,5 и 24 кГц), чем те, что предусмотрены стандартом MPEG1 - MPEG2 LSF (где LSF - это «Lower Sampling Frequencies» - то есть, «пониженные частоты дискретизации»). Оба стандарта, как MPEG2 ВС, так и MPEG2 LSF, были сформулированы к ноябрю 1994 года [26]. Стандарт MPEG2 ВС обеспечивал хорошее качество звучания в пяти каналах с диапазоном частот 20 Гц - 20 кГц при скорости потока данных 640-896 кбит/с [27].
Начиная с 1994 года усилия подкомитета MPEG Audio по стандартизации звука в рамках проекта MPEG2 были сосредоточены на том, чтобы определить требования к иному многоканальному стандарту с высоким качеством звучания, от которого не требовалось бы обеспечения обратной совместимости с MPEG1. Позже этот стандарт получил название MPEG2 AAC (Advanced Audio Coding) [18]. Цель таких исследований состояла в том, чтобы обеспечить качество звучания «неотличимое от естественного» («indistinguishable»), определенное документом ITU-R [28], при скоростях передачи данных 384 кбит/сек и ниже для пяти широкополосных звуковых каналов.
Испытания новой системы прошли в конце 1996 года на ВВС (Англия) и NHK (Япония) и показали, что MPEG2 ААС удовлетворяет требованиям ITU-R по качеству звучания для всех пяти широкополосных каналов при скорости потока данных 320 кбит/сек (а по данным NHK, даже при более низких скоростях).
Работа по системе MPEG2 ААС завершилась принятием международного стандарта в апреле 1997 года [29]. Схема кодирования MPEG2 ААС, кроме того, легла в основу звукового кодирования стандарта четвертого поколения MPEG4 [18, 30].
