Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Максимова.doc
Скачиваний:
10
Добавлен:
01.04.2025
Размер:
20.86 Mб
Скачать

Алгоритм кодирования mpeg

  1. Использовать фильтры-свёртки для разделения аудиосигнала на 32 частотные подполосы – фильтрация подполос.

  2. Определить объём маскируемых соседней полосой данных для каждой полосы, используя психоакустическую модель, описанную выше.

  3. Если данные в полосе находятся ниже порога маскировки, не кодировать эту полосу.

  4. Иначе, определить количество бит, необходимых для представления коэффициента, такого, чтобы шум, внесённый квантованием, был меньше влияния маскирования. (Необходимо помнить, что каждый бит, сэкономленный при квантовании, вносит примерно 6 дБ шума).

  5. Формирование потока на выходе.

Рис. 11.16. Алгоритм кодирования MPEG

Уровни mpeg

  • MPEG определяет 3 уровня для кодирования аудио. Общая модель одна, но сложность кодека увеличивается с каждым уровнем.

  • Данные разделяются на кадры, каждый из которых состоит из 384 отсчётов, по 12 отсчётов в каждой из 32 отфильтрованных подполос, см. ниже.

Рис. 11.17. Группирование отсчётов в подполосах для уровней MPEG 1, 2 и 3

Уровень 1: Фильтр, использующий дискретное косинусное преобразование с одним кадром и одинаковой частотой рассеивания в полосе. Психоакустическая модель использует только частотное маскирование. Уровень 1 обладает наименьшей сложностью и специально предназначен для использования в приложениях, где скорость кодера играет важную роль.

Уровень 2: Фильтр использует 3 кадра (предыдущий, текущий, следующий, всего используется 1152 отсчёта). Таким образом частично используется временное маскирование. Уровень 2 требует более сложной процедуры кодирования и немного более сложной декодирующей процедуры. По сравнению с Уровнем 1 ,Уровень 2 более эффективно подавляет несущественные составляющие сигнала и более эффективно применяет психоакустическую модель.

Уровень 3: Используется улучшенный фильтр критических полос (учитываются различные частоты). Психоакустическая модель включает в себя эффекты временного маскирования, учитывает избыточность стереосигнала, использует кодирование по Хаффману. Используется битовый резерв. Часто определенные фрагменты музыкального произведения не могут быть закодированы в рамках данного битового потока (битрейта) без ощутимых потерь качества. В этом случае mp3 использует небольшой запас битов, как буфер, кодируя менее сложные фрагменты в меньший битовый диапазон. Т.о., Уровень 3 является еще более сложным и разработан для приложений, требующих меньших битовых диапазонов. Его отличительные особенности – подавление несущественных составляющих сигнала и улучшенное извлечение слабо слышимых частот.

Кодирование избыточной информации в стереосигнале:

  • Intensity stereo coding – в высокочастотных подполосах кодируется суммированный из двух каналов сигнал вместо различных сигналов левого и правого каналов.

  • Middle/Side (MS) stereo coding – кодируется средний (общий; центральный) – сумма левого и правого каналов и разностный канал, содержащий информацию об отличиях левого и правого каналов.