Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора МИР.docx
Скачиваний:
12
Добавлен:
20.09.2019
Размер:
90.61 Кб
Скачать

11. Мультимедиа-технологии (основные понятия цифрового аудио и видео)

1.Звук – это волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда колебаний источника, тем больше интенсивность возбуждаемых им звуковых волн, следовательно, тем громче звук, воспринимаемый нашими органами слуха. Интенсивность звука в технике принято измерять в децибелах, сокращенно дБ (dB).

Частота звука измеряется в единицах в секунду, или, по-другому, в герцах, сокращенно – Гц (Hz). Частота определяет высоту тона, определяемую нашим ухом. Малые (низкие) частоты (десятки и сотни Гц) связаны в нашем сознании с глухими басами, а большие (высокие) частоты (тысячи и десятки тысяч Гц) – с пронзительным свистом. Человек способен воспринимать звуки в диапазоне частот примерно от 20 до 20000 Гц, более низкие и более высокие, чем порог слышимости, частоты называются соответственно инфразвуком и ультразвуком.

Чтобы закодировать звук, необходимо измерять амплитуду сигнала через определенные промежутки времени. Чем промежутки времени меньше, тем выше качество закодированного звука. Указанная процедура называется дискретизацией звука, а частота, с которой определяется амплитуда сигнала – частотой дискретизации. Например, частота 5000 Гц означает, что каждая запись звука производится через временные интервалы 1/5000 = 0,0002 с.

Амплитуда сигнала, определенная в каждый момент времени, также должна быть представлена в числовом виде. Приемлемое качество звука получается при использовании 16 бит (2 байта), что позволяет задать более 65000 разных значений амплитуды. Такая разрядность используется наиболее часто. Для записи стереозвука следует одновременно кодировать два независимых звуковых канала с указанными выше параметрами. Для создания же популярного «объёмного звука» может потребоваться до 8 каналов.

Для хранения звуковых файлов разработано большое количество форматов, использующих различные алгоритмы сжатия. Несжатый звук в системе Windows хранится в формате Microsoft Wave (Windows PCM, WAV). Форматы, поддерживающие сжатие, как и в случае графической информации, делятся на две группы: использующие сжатие без потерь и с потерями. Форматы первой группы (наиболее известны FLAC, Monkey’s Audio, WavPack, TTA) сжимают звук. В практике видеомонтажа используются звуковые форматы, сжимающие звук с потерями. Самым распространённым форматом сжатого звука является MPEG-1 Layer 3( MP3).

В настоящее время активно разрабатываются и другие звуковые форматы сжатия с потерями: Ogg Vorbis (OGG), Windows Media Audio (WMA), MPEG-4 AAC (MP4), обеспечивающие лучшее качество звука, чем MP3, при том же размере файла.

2.Видео – это набор быстро меняющихся статических изображений (кадров), синхронно с которым идёт звуковое сопровождение. Соответственно, если не используются методы сжатия графической (обычно её называют видеодорожкой) и аудиодорожек, то видео занимает гигантские объёмы памяти, до 80 Гбайт на час.

Существует три метода сжатия видео: без потерь, покадровое и потоковое сжатие.

Сжатие без потерь. Метод основан на LZW-алгоритме сжатия без потерь графических изображений, применяя его к видеокадрам и обеспечивая сжатие в 2-3 раза. Практически единственный кодек, работающий по этому алгоритму – HuffYUV. Кодек ресурсоёмок, для работы необходим мощный процессор (от 2 ГГц).

Покадровое сжатие. При использовании покадрового сжатия с помощью различных алгоритмов сжимается каждый кадр. Такая операция необременительна для современных процессоров, поэтому кодеки этой группы удобно использовать во время видеозахвата.

Лучшим из алгоритмов покадрового сжатия является Motion-JPEG или M-JPEG, основанный на JPEG-сжатии цифровых изображений. Фактически каждый кадр сжимается, и из них составляется видеоряд. Известно, что сжатие по алгоритму JPEG приводит к возможному появлению незначительного искажения картинки, в частности на резких границах изображения

Потоковое сжатие сжимает сразу несколько кадров, удаляя повторяющиеся фрагменты. Степень сжатия у потокового метода значительно выше, но оно вносит больше искажений в оригинал и затрудняет редактирование видео. Готовые видеофильмы чаще всего хранятся в формате с использованием потокового сжатия. Наиболее распространенными сегодня являются методы сжатия MPEG.

В результате одновременного применения всех описанных приемов исходный файл уменьшается примерно в 40 раз, и одна минута видеофильма занимает около 10 Мб

Качество при этом сопоставимо с качеством видеокассет VHS. Формат MPEG-4 обеспечивает не столь высокое качество, но позволяет очень сильно сжимать информацию. Этот формат был разработан для передачи информации по компьютерным сетям.

Файл, в который сохраняется видеозапись, имеет специальный формат. Помимо видеоряда и звуковой дорожки он должен содержать некоторую служебную информацию: какой формат применён для сжатия видео и звука, так называемый индекс- блок данных, который содержит адреса расположения конкретных участков записи, текстовые описатели- тэги. Формат такого файла называют контейнером. 1) контейнер AVI — стандартный контейнер для видеозаписей в системе Windows, его поддерживают все программы, которые работают с видео. Основной минус этого контейнера – плохая синхронизация аудио и видеоптоков. 2) MPEG. Также распространены контейнеры MPEG для MPEG–1 и –2 потоков. Достоинство контейнера – абсолютная синхронизация видео и аудиопотоков. 3) Windows Media. В этом контейнере могут использоваться только форматы сжатия Windows Media разных версий: WMA (Audio), WMV и MS MPEG–4 (Video). 4) RealMedia. Контейнер используется для хранения записей в формате RealVideo и RealAudio, потому он также мало распространён (как и Windows Media – это закрытый формат). 5) Apple Quicktime. Контейнер используется в первую очередь на компьютерной платформе Apple, расширение имён файлов .MOV. Контейнер не плох и универсален, но поддержка его на платформе Windows очень ограничена, формат закрытый, поэтому непопулярный.