Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Максимова.doc
Скачиваний:
10
Добавлен:
01.04.2025
Размер:
20.86 Mб
Скачать

TwinVq-кодирование

TwinVQ (Transform-domain Weighted Interleave Vector Quantization – векторное квантование с трансформными доменами и взвешенным чередованием) – новая технология компрессии звука, разработанная в NTT Human Interface Laboratories (Япония).

TwinVQ, также как и MP3, AAC или AC-3, является трансформным методом кодирования. Он использует некоторые инструменты AAC, такие, как межкадровое обратное предсказание, однако собственно кодирование музыки отличается в корне. В этом методе отдельные биты музыкальных данных не кодируются напрямую, а комбинируются в сегменты "шаблонов" (паттернов). Эти паттерны сравниваются со стандартными паттернами, генерирующимися в процессе кодирования/декодирования, затем выбирается наиболее близкий к оригиналу стандартный паттерн, и в качестве кода сжатия передается число, соответствующее этому паттерну. Искажения при кодировании минимальны даже при низких битовых диапазонах, что позволяет успешно регенерировать музыку и прочие звуки довольно близко к оригиналу. Технология TwinVQ должна была использоваться в разрабатываемом стандарте MPEG-4. Но тем не менее, для кодирования звука в стандарте MPEG-4 принят формат MP3.

TwinVQ был разработан для более мощных процессоров, чем MP3, поэтому для достижения такого сжатия он использует больших процессорных мощностей. Кодирование vqf-файла (это стандартное расширение для TwinVQ файлов) – достаточно медленный процесс. Даже если кодер является MMX-оптимизированным, при использовании максимального качества время кодирования примерно в 3 раза больше, чем кодирование MP3. Для достижения компрессии в реальном времени музыки с CD-качеством и максимальным качеством кодера требуется не меньше, чем P2-600! Процесс декодирования также немного более требователен к скорости процессора, чем MP3, однако проигрывание vqf в реальном времени вполне возможно на P-100. Но всё же желателен процессор не менее Pentium 233MMX.

Качество звука vqf-файла 96 Кбит/с в режиме высокого качества выше, чем качество MP3 128 Кбит/с, также в режиме высокого качества. Это означает, что в данном стандарте можно хранить высококачественные аудиофайлы со сжатием 1:15. Следовательно, на одном CD-ROM'е можно поместить 15 часов высококачественного стереозвука. Если вы хотите использовать высокие степени сжатия, TwinVQ действительно лучше, чем MP3. Как видно на иллюстрациях, в то время, как в mp3 присутствуют заметные издержки компрессии, звук vqf-файла "смягчен", то есть звучит он приятнее, чем MP3. Но при этом надо рассчитывать на то, что время кодирования в этот формат будет достаточно заметным даже на мощных компьютерах.

Frame49

Частотное (параллельное) маскирование

Заключается в том, что постоянно звучащий синусоидальный сигнал маскирует или "заглушает" более тихие близко лежащие на оси частот сигналы и маскирует другие синусоидальные сигналы, имеющие близкие частоты и много меньшие амплитуды. Причем маскируются в основном близкие по частоте звуки.

Временное (последовательное) маскирование

  • Воспроизводим 1 kHz маскирующий тон на уровне 60 dB, и тестовый тон с частотой 1.1 kHz на уровне 40 dB. Тестовый тон не слышен (он замаскирован).

  • Отключаем маскирующий тон, затем, после небольшой задержки, отключаем тестовый тон.

  • Уменьшаем время задержки до тех пор, пока тестовый тон еще слышен (например, 5 ms).

  • Повторяем, используя различную громкость тестового тона, и получаем:

  • Общий эффект от частотного и временного маскирования: