Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MMT_Lec.pdf
Скачиваний:
61
Добавлен:
10.06.2015
Размер:
1.18 Mб
Скачать

www.studforum.ru

UksusoFF

Стандарты цифрового телевидения

В настоящее время существуют следующие основные стандарты: DVB – европейский стандарт цифрового телевидения. Подвиды:

oDVB-S – Передача компрессированного видео и аудио, а также дополнительной информации через ИСЗ.

oDVB-S2 – То же, что DVB-S, с возможностью использовать дополнительные типы модуляции с увеличением пропускной способности канала связи в несколько раз, а также иными усовершенствованиями.

oDVB-SH – Спутниковое/наземное вещание, с возможностью мобильного приѐма. Возможность совместного использования спутниковых и наземных систем связи (так

называвемые гибридные сети).

oDVB-C – Передача компрессированного видео и аудио, а также дополнительной информации через кабельные сети.

o DVB-C2 – Цифровое кабельное телевидение «второго поколения»

oDVB-T – Передача компрессированного видео и аудио, а также дополнительной информации через сети наземного эфирного телевидения (стационарный приѐм).

oDVB-T2 – То же, что DVB-T, с использованием новых режимов модуляции и канального кодирования, что увеличивает пропускную способность канала связи по сравнению с DVB- T в два раза. Данный стандарт не совместим с DVB-T.

o DVB-H – То же, что DVB-T, только для подвижного приѐма.

oDVB-IPDC – Способ представления информации для мобильного телевидения DVB-H (в общем случае – для передачи по сетям IP).

ATSC – американский стандарт цифрового телевидения.

ISDB – японский стандарт цифрового телевидения со встроенными сервисами. Включает в себя описания цифрового ТВ и цифрового радиовещания. Используется для MPEG2.

Существуют три уровня качества цифрового телевидения:

SDTV (от англ. Standard-Definition Television – стандартное телевидение, иногда также расшифровывается как Standard Digital Television – стандартное цифровое телевидение) – цифровой вещательный формат, основанный на цифровом компонентном видеосигнале и сжатии MPEG2. Передача может быть как в формате 4:3, так и 16:9.

EDTV (от англ. Enhanced-definition television, extended-definition television) – телевидение повышенного разрешения. Использует прогрессивную развертку.

HDTV (англ. High-Definition Television) – телевидение высокой чѐткости или телевидение повышенной чѐткости, телевидение в высоком разрешении – набор стандартов телевизионного вещания повышенного качества посредством каналов связи (кабельные, спутниковые сети, цифровые носители). Вещает только в широкоформатном разрешении.

Видеостандарты

Видеоизображение стандарта PAL или SECAM – это последовательность картинок, отображаемая с частотой 25 кадров в секунду. В одном цифровом кадре содержится 720х576 точек, то есть 414 тыс. 720 элементов (пикселей). Каждая точка может иметь один из 16,7 млн. цветов и занимать 3 байта в компьютере. Следовательно, один кадр занимает порядка 1,2 Мб. При стандартной частоте получаем цифру около 30 Мб в секунду, то есть хранение одного лишь часа видео (вместе со звуком) без компрессии обойдѐтся в 107 Гб.

Максимально возможное качество сейчас достигается в HDTV, этот формат подразумевает разрешение

- 16 -

www.studforum.ru

UksusoFF

1920х1080 точек, то есть, при прочих равных условиях, серия кадров, рассчитанных на одну секунду, уже займет 148 Мб (521 Гб в час).

Чтобы избежать подобных объемов хранимого видео и нерационального использования ресурсов компьютера, а также получить возможность распространения видеосюжетов, были созданы различные способы сжатия видео.

Контейнер – основополагающий файл, служащий для сохранения в цифровом виде преобразованной аналоговой информации (т.е. то, что мы видим и слышим в реальной жизни). Как правило, такая сохраненная аудио и видео информация занимает большой объем, поэтому ее сжимают, используя различные аудио и видео кодеки. Все служебные для работы с этим файлом, как правило, устанавливаются вместе с операционной системой.

Структура контейнера:

Кодек – сокращение от английского Coder/Decoder – программа, позволяющая преобразовать записанную информацию так, чтобы она занимала меньше места. При этом расширение файла может не меняться, т.е. основная структура контейнера не изменится, изменится представление в нем аудио и видеоданных, но чтобы воспроизвести такой файл, «зашифрованный» при помощи какого-либо кодека, необходимо, чтобы он был установлен на компьютере пользователя.

MPEG (англ. Moving Picture Experts Group – русск. Группа экспертов по движущемуся изображению) – группа специалистов в подчинении ISO, собирающаяся для выработки стандартов сжатия цифрового видео и аудио. Группа работала в трех направлениях:

MPEG Video – сжатие видео сигнала; MPEG Audio – сжатие аудио сигнала;

MPEG System – используется для сохранения полученных потоков.

Стандарты MPEG не накладывают жестких ограничений на кодеки и описывают лишь достаточно общие требования к выходному потоку и алгоритмам кодирования и декодирования. Это позволяет разработчикам создавать достаточно гибкие алгоритмы.

MPEG-1

Характеристики MPEG-1

Разрешение: 352x240x30, 352x288x25.

Плюсы: сравнительная простота в аппаратной реализации; содержит преобразования, поддерживаемые на аппаратном уровне большим количеством видеокарт.

Минусы: невысокая степень сжатия; поддержка только прогрессивной развертки. MPEG-1 состоит из нескольких частей:

- 17 -

www.studforum.ru

UksusoFF

1.синхронизация и мультиплексирование аудио и видео (MPEG-1 Program Stream);

2.кодек для видео с прогрессивной разверткой;

3.кодек для звука;

Стандарт MPEG-1 определяет три уровня сжатия звука:

a.MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1);

b.MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2);

c.MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3).

4.процедуры тестирования производительности;

5.эталонное ПО (Reference software).

MPEG-2

Характеристики MPEG-2

Поток: 9000 Кбит/с (наиболее распространенный), а так же до 40 Мбит/с. Разрешение: нет ограничений.

Плюсы: поддержка достаточно серьезных звуковых стандартов Dolby Digital 5.1, DTS; высокая универсальность; сравнительная простота аппаратной реализации; поддерживает прогрессивную и чересстрочную развертку.

Минусы: недостаточная степень сжатия, недостаточная гибкость.

Стандарт MPEG-2 в основном используется для кодирования видео и аудио при цифровом вещании, а так же для записи информации на оптический диски (DVD, BD).

MPEG-2 сжатие

Технология сжатия видео в MPEG-2 делится на два этапа:

1.уменьшение избыточности видеоинформации о временном измерении, основывается на похожести соседних кадров;

2.сжатие отдельных изображений.

MPEG-2 использует четыре типа кадра:

независимо сжатые кадры (I-кадры);

Обеспечивают возможность произвольного доступа к любому кадру, являясь своеобразными входными точками в поток данных для декодера. Их частота выбирается в зависимости от требований на время произвольного доступа и от надежности канала передачи. Соответствующие группы кадров от одного I-кадра до другого образуют GOP – Group of Pictures – группу кадров.

кадры, сжатые с использованием предсказания движения в одном направлении (P-кадры); Используют ссылку на один I или P-кадр, повышая тем самым степень сжатия видеопотока. Частота использования определяется исходя из аппаратных возможностей и требований к качеству.

кадры, сжатые с использованием предсказания движения в двух направлениях (B-кадры); Используют ссылки на кадры находящиеся впереди и позади них, обеспечивают наивысшую степень сжатия, на них ссылаться нельзя. Частота использования определяется исходя из аппаратных возможностей и требований к качеству.

независимо сжатые с большой потерей качества, используются только при быстром поиске (DCкадры).

- 18 -

www.studforum.ru

UksusoFF

Общая схема кодирования MPEG-2

Вцелом весь конвейер преобразований можно представить так:

1.подготовка макроблоков;

Для каждого макроблока определяется, каким образом он будет сжат. В I-кадрах все макроблоки сжимаются независимо. В P-кадрах блок либо сжимается независимо, либо представляет собой разность с одном из макроблоков в предыдущем опорном кадре, на который ссылается P-кадр.

Макроблок – это группа из четырех соседних блоков в плоскости яркостной компоненты Y (матрица пикселов 16x16 элементов) и два соответствующих им по расположению блока из плоскостей цветности U и V.

2.перевод макроблока в цветовое пространство YUV. Получение нужного количества матриц 8х8;

3.для P-блоков и B-блоков производится вычисление разности с соответствующим макроблоком в опорном кадре;

4.применение дискретного косинус-преобразования;

5.квантование;

6.зигзаг-сканирование;

7.групповое кодирование;

8.кодирование Хаффмана.

При декодировании весь конвейер повторяется для обратных преобразований, начиная с конца.

MPEG-4

MPEG-4 – это международный стандарт, используемый, преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году, и включает в себя группу стандартов сжатия аудио и видео и смежные технологии, одобренные ISO. Изначально разрабатывался как стандарт для работы со сверхнизкими потоками аудио и видео, но в настоящий момент используется для кодирования видео с самым разным качеством.

Части стандарта MPEG-4

MPEG-4 состоит из нескольких стандартов, называемых «parts», включая следующие:

(жирным выделены части упомянутые в лекции)

Part 1 (ISO/IEC 14496-1): Systems: Описывает синхронизацию и мультиплексирование видео и аудио. Например транспортный поток.

Part 2 (ISO/IEC 14496-2): Visual: Описывает кодеки для видео (видео, статических текстур, синтетических изображений и т. д.). Один из нескольких «профилей» в Part 2 – это Advanced Simple Profile (ASP) – наиболее широко используемая часть стандарта MPEG-4.

Part 3 (ISO/IEC 14496-3): Audio: Набор кодеков для сжатия звука и речи, включая Advanced Audio Coding (AAC) и несколько инструментов для обработки звука (речи).

Использует звук без сжатия, следовательно обеспечивает максимально качество. Психо-акустические модели позволяют точно описать, что можно безопасно удалить из исходного сигнала без значительного ухудшения качества звука. Позволяет значительно снизить размер звукового файла. Создан в 1997 году институтом Францгофера.

Характеристики:

1.поддержка до 48 каналов;

2.частота дискретизации звука – 8-9,6 кГц;

3.более эффективный и простой банк фильтров;

4.более качественное кодирование частот выше 16 кГц;

5.более гибкий режим кодирования стереосигналов;

6.дополнительные возможности стандарта, повышающие эффективность компрессии;

7.MDCT;

8.TNS.

-19 -

www.studforum.ru

UksusoFF

Part 4 (ISO/IEC 14496-4): Conformance: Описывает процедуру тестирования на совместимость частей стандарта.

Part 5 (ISO/IEC 14496-5): Reference Software: Содержит программы (software) для демонстрации и более ясного описания других частей стандарта.

Part 6 (ISO/IEC 14496-6): Протокол управления мультимедийными потоками (Delivery Multimedia

Integration Framework-DMIF).

Part 7 (ISO/IEC 14496-7): Optimized Reference Software: Provides examples of how to make improved implementations (e.g., in relation to Part 5).

Part 8 (ISO/IEC 14496-8): Carriage on IP networks: Specifies a method to carry MPEG-4 content on IP networks.

Part 9 (ISO/IEC 14496-9): Reference Hardware: Provides hardware designs for demonstrating how to implement the other parts of the standard.

Part 10 (ISO/IEC 14496-10): Advanced Video Coding: A codec for video signals which is also called AVC and is technically identical to the ITU-T H.264 standard.

Part 11 (ISO/IEC 14496-11): Описание сцены.

Part 12 (ISO/IEC 14496-12): Формат медиафайлов ИСО.

Part 13 (ISO/IEC 14496-13): Intellectual Property Management and Protection (IPMP) Extensions. Part 14 (ISO/IEC 14496-14): Формат файла MP4.

Part 15 (ISO/IEC 14496-15): AVC File Format: For storage of Part 10 video based on Part 12. Part 16 (ISO/IEC 14496-16): Animation Framework eXtension (AFX).

Part 17 (ISO/IEC 14496-17): Потоковый текстовый формат – субтитры.

Part 18 (ISO/IEC 14496-18): Font Compression and Streaming (for OpenType fonts). Part 19 (ISO/IEC 14496-19): Synthesized Texture Stream.

Part 20 (ISO/IEC 14496-20): Облегченное приложение воспроизведения сцен Lightweight Scene Representation (LASeR) (not yet finished – reached «FCD» stage in January 2005).

Part 21 (ISO/IEC 14496-21): MPEG-J Graphical Framework eXtension (GFX) (not yet finished – at

«FCD» stage in July 2005, FDIS January 2006).

Part 22 (ISO/IEC 14496-22): Open Font Format Specification (OFFS) based on OpenType (not yet finished – reached «CD» stage in July 2005)

Также внутри частей («parts») определены профили стандартов, поэтому реализация какой-то части стандарта ещѐ не означает полной поддержки этой части.

Банк фильтров – преобразование, которое позволяет сжать сигнал за счет определенного ухудшения качества.

Банк фильтров – преобразование, переводящее сигнал из временной области в частотно-временную область (аналогично построению спектрограммы).

MDCT (Модифицированное дискретное косинус-преобразование) – модифицированное дискретное косину-преобразование.

Технология TNS (temporal noise shaping, формирование шума во временной области) в стандарте AAC позволяет управлять распространением шума квантования по времени в пределах каждого окна MDCT. Технология TNS основана на подобии (частотно-временном дуализме) амплитудной огибающей сигнала и огибающей его спектра, а также на использовании линейного предсказания (LPC) по частоте при квантовании спектра.

Позволяет добиться более эффективного сжатия сигнала за счет дополнительной обработки звука.

- 20 -

www.studforum.ru

UksusoFF

AAC

AAC (Advanced Audio Coding) является частью стандартов MPEG-4. Использует контейнер MP4 (который базируется на контейнере Apple MOV), чтобы хранить свои метаданные (например, информацию тегов). Как часть стандартов MPEG-4, формат AAC кодирует файлы с возможностью внедрения до 48 широкополосных аудиоканалов (до 96 kHz) и 15 низкочастотных каналов расширения (с ограничением до 120 Hz) плюс 15 потоков данных.

Список некоторых объектных типов:

MPEG-2 AAC LC / Low Complexity – Низкая сложность Характеризуется появлением технологии PNS (генерация (синтез) шума).

При кодировании идентифицируются участки спектра, представляющие собой шум, и соответствующие группы MDCT-коэффициентов исключаются из процесса кодирования. Частотная полоса помечается как шумовая, и для нее запоминается общая энергия шума.

При декодировании в частотные полосы, помеченные как шумовые, подставляются псевдослучайные MDCT-коэффициенты с требуемой общей мощностью. В результате в указанных частотных диапазонах синтезируется шум, близкий по звучанию к исходному шуму.

PNS (Perceptual noise substitution) – перцептуальное замещение шума. Целью этой функции является дальнейшая оптимизация битрейтовой производительности AAC на низких битрейтах. Техника PNS основана на том наблюдении, что "один шум звучит так же, как и другой". Это означает, что фактическая мелкая структура шумового сигнала незаметна в субъективном восприятии такого сигнала. Следовательно, вместо передачи реальных спектральных компонент шумового сигнала, поток данных только сообщает о том, что эта частотная область похожа на шумовую, и дает некоторую дополнительную информацию о полной мощности в этом диапазоне.

MPEG-2 AAC Main

MPEG-2 AAC SSR / Scalable Sampling Rate MPEG-4 AAC LC / Low Complexity MPEG-4 AAC Main

MPEG-4 AAC SSR / Scalable Sampling Rate MPEG-4 AAC LTP / Long Term Prediction

MPEG-4 AAC HE / High Efficiency – Высокая эффективность Характеризуется появлением технологии SBR (Spectral Band Replication).

SBR (Spectral Band Replication) – можно перевести как Повторение Спектральной Широты. Иначе, если не дословно: Дублирование Спектра Звучания.

SBR использовалось с AAC (впоследствии стало называется aacPlus или AAC+) или MP3 (называется mp3PRO) с целью увеличения эффективности кодирования этих стандартных кодеков, но только для низких битрейтов, таких как 20-64 kbps для AAC и 32-96 kbps для mp3PRO. Оно не используется для высоких битрейтов, так как кодеки имеют достаточно "сил", чтобы закодировать высокие частоты без SBR.

MPEG-4 AAC HE v2

Добавлена технология PS (Parametric Stereo). MPEG-4 AAC LD / Low Delay

Объектые типы отличаются друг от друга сложностью. Из-за этой сложности, некоторые типы на порядок дольше кодируют/декодируют файлы. Кроме того, выгода от использования самых сложных методов кодирования зачастую не стоит потраченных на них ресурсов процессора. В результате, наибольшее распространение и поддержку декодерами получил объектный тип Low Complexity/LC. Однако, профиль High Efficiency (HE) начинает становится популярным, потому что его добавили в кодер Nero AAC.

- 21 -

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]