Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ТСИ.doc
Скачиваний:
32
Добавлен:
18.11.2019
Размер:
2.21 Mб
Скачать

Цифровое видео

Изобретение радио продемонстрировало, что звуковые волны могут быть преобразованы в электромагнитные и переданы на большие расстояния к радиоприемникам. Аналогично телекамера преобразует информацию цвета и яркости индивидуальных оптических изображений в электрические сигналы, которые могут быть переданы в эфир или записаны на видеопленку. Подобно кинофильму, телевизионные сигналы преобразуются в кадры информации и проецируются с частотой, достаточно высокой, чтобы человеческий глаз воспринимал их смену как непрерывное движение.

Известны 3 формы кодирования сигнала телевидения:

  • ·        Система PAL  (использует большинство стран Европы);

  • ·        SECAM (используют Франция, Россия и некоторые восточно-европейские страны). SECAM отличается от системы PAL только в тонкостях, однако этого достаточно, чтобы они были несовместимы;

  • ·        NTSC (США и Япония)

В системе PAL (Phase-Alternation-Line, чередование строк) каждый законченный кадр заполняется построчно, сверху донизу. В Европе используется переменный электрический ток с частотой 50 Гц, и это является причиной того, что в системе PAL выполняется 50 проходов экрана каждую секунду. Требуется 2 прохода, чтобы нарисовать полный кадр, так как частота кадров равна 25 кадров/с. Нечетные строки выводятся при первом проходе, четные – на втором. Этот метод известен как « чересстрочная  развертка», в противоположность чему изображение на компьютерном мониторе, создаваемое за один проход, называется «без чередования строк».

Компьютеры, наоборот, имеют дело с информацией в цифровой форме. Чтобы хранить визуальную информацию в цифровой форме, аналоговый видеосигнал должен быть переведен в цифровой эквивалент с  использованием достаточно сложной схемы – аналого-цифрового преобразователя (АЦП или analogue-to-digital converter ADC). Процесс преобразования известен как осуществление оцифровки, или видеозахват. Так как компьютеры имеют дело с цифровой графической информацией, никакая другая специальная обработка данных не требуется, чтобы воспроизвести цифровое видео на компьютерном мониторе. Однако чтобы отобразить цифровое видео на обычном телевизоре, цифроаналоговый преобразователь (ЦАП или digital-to- analogue converter , DAC) должен преобразовать двоичную информацию обратно в аналоговый сигнал. Кроме того, источником видеоинформации  в цифровой форме являются цифровые видеокамеры.

Обработка аудиоинформации

Профессиональные звуковые платы позволяют выполнять сложную обработку звука, обеспечивают стереозвучание, имеют собственное ПЗУ с хранящимися в нем сотнями тембров звучаний различных музыкальных инструментов. Звуковые файлы обычно имеют очень большие размеры. Поэтому платы Sound Blaster, помимо своих основных функций, обеспечивают автоматическое сжатие файлов.

Область применения звуковых плат – компьютерные игры, обучающие программные системы, рекламные презентации, «голосовая почта» между компьютерами, озвучивании различных событий, происходящих в компьютерном оборудовании, таких, например, как отсутствие бумаги в принтере и т.п.

Для записи звука к звуковой плате может быть подключен микрофон или устройство воспроизведения звука.  Для воспроизведения звука к ее выходу могут быть подключены акустические колонки или наушники, а также любая акустическая система.

Компоненты платы

Звуковая плата ПК содержит несколько аппаратных систем, связанных с производством и сбором аудиоданных, две основные аудиоподсистемы, предназначенные для цифрового « аудиозахвата», синтеза и воспроизведения музыки. Исторически подсистема синтеза и  воспроизведения музыки генерирует  звуковые волны одним из двух способов:

  • ·        Через внутренний ЧМ-синтезатор(FM-синтезатор)

  • ·        Проигрывая оцифрованный звук

Секция цифровой звукозаписи звуковой платы включает пару 16-разрядных преобразователей – цифроаналоговый (ЦАП) и аналогово-цифровой (АЦП) и программируемый генератор частоты выборки, синхронизирующий преобразователи и управляемый ЦП. Компьютер передает  оцифрованные звуковые данные к преобразователям или обратно. Частота преобразования обычно кратна (или часть от) 44,1 кГц.

Большинство плат использует один или более каналов прямого доступа к памяти, некоторые платы также обеспечивают прямой цифровой вывод, используя  оптическое или коаксиальное подключение S/PDIF (цифровой звук в стандарте /Philips Digital Interface).

Генератор звука, установленный на плате, использует процессор цифровых сигналов (Digital Signal Processor, DSP), который проигрывает требуемые музыкальные ноты, объединяя их считывание из различных областей звуковой таблицы с различными скоростями, чтобы получить требуемую высоту тона. Максимальное количество доступных нот связано с мощностью   DSP-процессора и называется «полифонией» платы.

DSP-процессоры используют сложные алгоритмы, чтобы создать эффекты типа реверберации, хорового звучания и запаздывания. Реверберация создает впечатление, что инструменты играют в больших концертных залах. Хор используется, чтобы создать впечатление, что несколько инструментов играют совместно, тогда как фактически есть только один. Добавление запаздывания к партии гитары, например, может дать эффекты пространства и стереозвучания.

Частотная модуляция

Первой широко распространенной технологией, которая используется в звуковых платах, является частотная модуляция (ЧМ), которая была разработана в начале 1970-х гг. Дж. Чоунингом (Стэндфорский университет). ЧМ-синтезатор (FM-синтезатор) производит звук, генерируя чистую синусоидальную волну (несущая) и смешивая ее со вторым сигналом (модулятор). Когда эти две формы волны близкие в частоте, создается волна сложной формы. Управляя несущей и модулятором, можно создавать различные тембры, или инструменты.

Каждый голос ЧМ-синтезатора требует минимум двух генераторов сигнала, обычно, называемых «операторами».  Разные конструкции ЧМ-синтезатора имеют  различные степени управления параметрами оператора. Сложные системы ЧМ могут использовать четыре или шесть операторов на каждый голос, и операторы могут иметь корректируемые параметры, которые позволяют настроить скорости нарастания и угасания сигнала.

Yamaha была первой компанией, которая вложила капитал в исследования по теории Чоуминга, что привело к разработке легендарного синтезатора DX7. Специалисты  Yamaha скоро поняли, что смешивание более широкого диапазона несущих и модуляторов позволяет более сложные тембры, приводя к реалистичным звучащим инструментам. Аппаратные средства синтезатора используют параметры, загружаемые программным драйвером, чтобы управлять каскадными генераторами ЧМ, которые создают аналог акустических и электронных музыкальных инструментов. Методы синтеза ЧМ полезны для того, чтобы создать выразительные новые звуки. Однако если цель синтезирующей системы состоит в том, чтобы воспроизвести звук некоторого существующего инструмента, это лучше делать в цифровой форме на основе выборок сигналов, как при синтезе с использованием звуковых таблиц(WaveTable synthesis).

Табличный синтез (WaveTable synthesis)

Чтобы создавать звук, звуковая таблица использует не несущие и модуляторы, а выборки звуков реальных инструментов. Выборка – цифровое представление формы звука, произведенного инструментом. Платы, использующие ISA, обычно сохраняют выборки в ROM, хотя более новые PCI-изделия используют основную оперативную память ПК, которая загружается при запуске ЩС и может включать новые звуки.

В то время как все звуковые платы ЧМ звучат аналогично, платы звуковых таблиц значительно отличаются по качеству. Качество звучания инструментов включает факторы:

  • ·        Качество первоначальной записи;

  • ·        Частота, на которой выборки были записаны;

  • ·        Количество выборок, используемых для каждого инструмента;

  • ·        Методы сжатия, использованные для сохранения выборки;

Большинство стандартных выборок записаны в стандарте 16 бит и 44,1 кГц, но многие изготовители сжимают данные так, чтобы больше выборок или инструментов можно было записать в ограниченный объем памяти. Однако сжатие часто приводит к потере динамического диапазона или качества.

Проигрывание выборки на более высокой скорости, чем ее оригинал, приводит к более высокому воспроизводимому звуку, позволяя инструментам играть более нескольких октав. Однако если некоторые тембры воспроизводятся быстро, они звучат слишком слабо и тонко; аналогично, когда выборка проигрывается слишком медленно, она звучит мрачно и неестественно.   Чтобы преодолеть эти эффекты, изготовители разбивают клавиатуру на несколько областей и применяют соответствующие выборки звуков инструментов.

Для каждого инструмента должно быть записано много выборок и их разновидностей, чтобы синтезатор точно воспроизвел этот диапазон звука, а это неизбежно требует большого количества памяти. Типичная звуковая плата может содержать до 700 инструментальных выборок в пределах ROM 4 Мбайт.

Обновление звуковой таблицы не всегда означает необходимость покупать новую звуковую плату. Большинство 16-разрядных звуковых плат имеет разъем, который может соединиться с дополнительной платой звуковой таблицы. Качество звучания инструментов, которые такие платы обеспечивают, значительно различается, и это обычно зависит от того, какой объем памяти расположен на плате.

Формат сжатия звука MP3

Разработанный на основе исходного MPEG-1 стандарт MP3(сокращение от аудио MPEG, уровень 3) является одной из трех систем кодирования(Layer (уровень) 1, Layer II и Layer III) для сжатия аудиосигналов. Общая структура процесса кодирования одинакова для всех для всех уровней. Для каждого уровня определен свой формат записи битового потока и свой алгоритм декодирования. Алгоритмы MPEG основаны в целом на изученных свойствах восприятия звуковых сигналов слуховым аппаратом человека.

Выходной цифровой сигнал сначала раскладывается на частотные составляющие спектра. MP3-стандарт делит спектр частоты на 576 полос частоты и сжимает каждую полосу независимо. Затем этот спектр очищается от заведомо неслышных составляющих – низкочастотных шумов и наивысших гармоник, т. е фильтруется. На следующем этапе производится значительно более сложный психоакустический анализ слышимого спектра частот. Это делается в том числе с целью выявления и удаления «замаскированных» частот (частот, которые не воспринимаются слухом ввиду их приглушения другими частотами). Если два звука происходят в то же время, MP3 делает запись только того, который будет фактически воспринят. Тихий звук немедленно после громкого также может быть удален, так как ухо адаптируется к громкости. Если звук идентичен на обоих каналах стерео, этот сигнал сохраняется 1 раз, но воспроизводится на обоих каналах, когда MP3 файл – декомпрессирован и озвучивается.

Затем, в зависимости от уровня сложности используемого алгоритма, может быть также произведен анализ предсказуемости сигнала. В довершение ко всему производится сжатие уже готового битового потока упрощенным аналогом алгоритма Хаффмана, что позволяет также значительно уменьшить занимаемый потоком объем.

Как было указано выше, стандарт MPEG-1 имеет три уровня. Эти уровни различаются по обеспечиваемому коэффициенту сжатия и качеству звучания получаемых потоков, Layer 1 позволяет сигналы 44,1 КГц/16 бит хранить без ощутимых потерь качества при скорости потока 384 Кбит/с, что составляет 4-кратный выигрыш в занимаемом объеме; Layer II обеспечивает такое же качество при 194 Кбит/с, а Layer III – при 128. Выигрыш Layer III очевиден, но скорость компрессии при его использовании самая низкая (надо отметить, что при современных скоростях процессоров это ограничение уже незаметно).