Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КНИГА_ТСИ.doc
Скачиваний:
122
Добавлен:
18.09.2019
Размер:
10.81 Mб
Скачать
  1. Обработка аудиоинформации

Профессиональные звуковые платы позволяют выполнять слож­ную обработку звука, обеспечивают стереозвучание, имеют собст­венное ПЗУ с хранящимися в нем сотнями тембров звучаний раз­личных музыкальных инструментов. Звуковые файлы обычно име­ют очень большие размеры. Так, трехминутный звуковой файл со стереозвучанием занимает примерно 30 Мбайт памяти. Поэтому платы Sound Blaster, помимо своих основных функций, обеспечива­ют автоматическое сжатие файлов.

Компоненты платы

Звуковая плата ПК содержит несколько аппаратных систем, связанных с производством и сбором аудиоданных, две основные аудиоподсистемы, предназначенные для цифрового «аудиозахвата», синтеза и воспроизведения музыки (рис. 6.6). Исторически подсис­тема синтеза и воспроизведения музыки генерирует звуковые волны одним из двух способов:

  • через внутренний ЧМ-синтезатор (FM-синтезатор);

  • проигрывая оцифрованный (sampled) звук.

Секция цифровой звукозаписи звуковой платы включает пару 16-разрядных преобразователей  цифроаналоговый (ЦАП) и ана­лого-цифровой (АЦП) и программируемый генератор частоты вы­борки, синхронизирующий преобразователи и управляемый ЦП. Компьютер передает оцифрованные звуковые данные к преобразователям или обратно. Частота преобразования обычно кратна (или часть от) 44,1 кГц.

Большинство плат использует один или более каналов прямого доступа к памяти, некоторые платы также обеспечивают прямой цифровой вывод, используя оптическое или коаксиальное подключе­ние S/PD1F (цифровой звук в стандарте Sony/Philips Digital Interface).

Генератор звука, установленный на плате, использует процессор цифровых сигналов (Digital Signal Processor  DSP), который про­игрывает требуемые музыкальные ноты, объединяя их считывание из различных областей звуковой таблицы с различными скоростя­ми, чтобы получить требуемую высоту тона. Максимальное количе­ство доступных нот связано с мощностью DSP-процессора и назы­вается «полифонией» платы.

DSP-процессоры используют сложные алгоритмы, чтобы создать эффекты типа реверберации, хорового звучания и запаздывания. Ре­верберация создает впечатление, что инструменты играют в больших концертных залах. Хор используется, чтобы создать впечатление, что несколько инструментов играют совместно, тогда как фактически есть только один. Добавление запаздывания к партии гитары, напри­мер, может дать эффект пространства и стереозвучания.

Частотная модуляция. Первой широко распространенной тех­нологией, которая используется в звуковых платах, является час­тотная модуляция (ЧМ), которая была разработана в начале 1970-х гг. Дж. Чоунингом (Стэнфордский университет). ЧМ-синте­затор (FM-синтезатор) производит звук, генерируя чистую сину­соидальную волну (несущая) и смешивая ее со вторым сигналом (модулятор). Когда эти две формы волны близки в частоте, созда­ется волна сложной формы. Управляя несущей и модулятором, можно создавать различные тембры, или инструменты.

Каждый голос ЧМ-синтезатора требует минимум двух генерато­ров сигнала, обычно называемых «операторами». Разные конструк­ции ЧМ-синтезатора имеют различные степени управления пара­метрами оператора. Сложные системы ЧМ могут использовать че­тыре или шесть операторов на каждый голос, и операторы могут иметь корректируемые параметры, которые позволяют настроить скорости нарастания и угасания сигнала.

Yamaha была первой компанией, которая вложила капитал в ис­следования по теории Чоунинга, что привело к разработке леген­дарного синтезатора DX7. Специалисты Yamaha скоро поняли, что смешивание более широкого диапазона несущих и модуляторов по­зволяет создать более сложные тембры, приводя к реалистически звучащим инструментам.

Хотя системы ЧМ были осуществлены в аналоговом исполнении на ранних клавиатурных синтезаторах, в дальнейшем выполнение синтеза ЧМ было сделано в цифровой форме. Методы синтеза ЧМ очень полезны для того, чтобы создать выразительные новые звуки. Однако если цель синтезирующей системы состоит в том, чтобы вос­произвести звук некоторого существующего инструмента, это лучше делать в цифровой форме на основе выборок сигналов, как при син­тезе с использованием звуковых таблиц (WaveTable synthesis).

Табличный синтез (WaveTable synthesis). Чтобы создать звук, зву­ковая таблица использует не несущие и модуляторы, а выборки зву­ков реальных инструментов. Выборка  цифровое представление формы звука, произведенного инструментом. Платы, использующие ISA, обычно сохраняют выборки в ROM, хотя более новые PCf-изделия используют основную оперативную память ПК, которая за­гружается при запуске ОС (например, Windows) и может включать новые звуки.

В то время как все звуковые платы ЧМ звучат аналогично, пла­ты звуковых таблиц значительно отличаются по качеству. Качество звучания инструментов включает факторы:

  • качество первоначальной записи;

  • частота, на которой выборки были записаны;

  • количество выборок, использованных для каждого инстру­мента;

  • методы сжатия, использованные для сохранения выборки.

Большинство инструментальных выборок записаны в стандарте 16 бит и 44,1 кГц, но многие изготовители сжимают данные так, чтобы больше выборок или инструментов можно было записать в ограниченный объем памяти. Однако сжатие часто приводит к поте­ре динамического диапазона или качества.

Когда аудиокассета воспроизводится слишком быстро или слишком медленно, ее высота звучания меняется, и это справедливо также для цифровой звукозаписи. Проигрывание выборки на более высокой скорости, чем ее оригинал, приводит к более высокому воспроизводимому звуку, позволяя инструментам играть более не­скольких октав. Однако если некоторые тембры воспроизводятся быстро, они звучат слишком слабо и тонко; аналогично, когда вы­борка проигрывается слишком медленно, она звучит мрачно и неес­тественно. Чтобы преодолеть эти эффекты, изготовители разбивают клавиатуру на несколько областей и применяют соответствующие выборки звуков инструментов в каждой из них.

Каждый инструмент звучит с различным тембром в зависимости от стиля игры. Например, при мягкой игре на фортепьяно не слышен звук молоточков, бьющих по струнам. При более интенсивной игре мало того что звук становится более очевидным, но можно за­метить также и изменения тона.

Для каждого инструмента должно быть записано много выборок и их разновидностей, чтобы синтезатор точно воспроизвел этот диа­пазон звука, а это неизбежно требует большего количества памяти. Типичная звуковая плата может содержать до 700 инструментальных выборок в пределах ROM 4 Мбайт. Точное воспроизведение фор­тепьяно соло, однако, требует от 6 до 10 Мбайт данных, вот почему нет никакого сравнения между синтезируемым и реальным звуком.

Обновление звуковой таблицы не всегда означает необходимость покупать новую звуковую плату. Большинство 16-разрядных звуко­вых плат имеет разъем, который может соединиться с дополнитель­ной платой звуковой таблицы (daughterboard)  рис. 6.6. Качество звучания инструментов, которые такие платы обеспечивают, значи­тельно различается, и это обычно зависит от того, какой объем памя­ти расположен на плате. Большинство плат содержит от 1 до 4 Мбайт выборок и предлагает целый ряд цифровых звуковых эффектов.

Коннекторы звуковой платы. В 1998 г. Creative Technology был выпущен очень успешный образец звуковой платы SoundBlaster Live!, ставший в дальнейшем стандартом де-факто.

Версия Platinum 5.1 карты Creative SoundBlaster Live!, которая появилась к концу 2000 г., имела следующие гнезда и соединители (рис. 6.7):

  • аналого-цифровой выход: либо сжатый сигнал в формате Dolby АС-3 SPDIF с 6 каналами для подключения внешних цифровых устройств или динамиков цифровых систем, либо аналоговая система громкоговорителей 5.1;

  • линейный вход  соединяется с внешним устройством типа кассетного, цифрового магнитофона, плеера и пр.;

  • микрофонное гнездо  соединяется с внешним микрофоном для ввода голоса;

  • линейный выход  соединяется с динамиками или внешним усилителем для аудиовывода или наушниками;

  • соединитель джойстика/MlDl  соединяется с джойстиком или устройством MIDI и может быть настроен так, чтобы со­единяться с обоими одновременно;

  • CD/SPDIF соединитель  соединяется с выводом SPDIF (цифровое аудио), расположенном на дисководе DVD или CD-ROM;

  • дополнительный аудиовход  соединяется с внутренними аудиоисточниками типа тюнера, MPEG или других подобных плат;

  • соединитель аудиоСО  соединяется с аналоговым аудиовыво-дом на CD-ROM или DVD-ROM, используя кабель аудиоСО;

  • соединитель автоответчика  обеспечивает монофоническую связь со стандартным голосовым модемом и передает сигналы микрофона к модему.

Аудиорасширение (цифровой ввод-вывод)  соединяется с циф­ровой платой ввода-вывода (располагается в свободной нише нако­пителя на 5,25", выходящей на переднюю панель компьютера), ино­гда называемой Live'Drive. Обеспечивает следующие соединения:

  • гнездо RCA SPDIF  соединяется с устройствами цифровой звукозаписи типа цифровой ленты и мини-дисков;

  • гнездо наушников  соединяется с парой высококачествен­ных наушников, вывод динамика отключается;

  • регулировка уровня наушников  управляет громкостью сиг­нала наушников;

  • второй вход (линейный/микрофонный)  соединяется с вы­сококачественным динамическим микрофоном или аудиоисточником (электрическая гитара, цифровое аудио или мини-диск);

  • переключатель второго входа (линейный/микрофон);

  • соединители MIDI  соединяются с устройствами MIDI через кабель Mini DIN-Standard DIN;

  • инфракрасный порт (сенсор)  позволяет организовать дис­танционное управление ПК;

  • вспомогательные гнезда RCA  соединяются с оборудованием бытовой электроники (видеомагнитофон, телевизор или про­игрыватель компакт-дисков);

  • оптический вход-выход SPD1F  соединяется с устройствами цифровой звукозаписи типа цифровой ленты или мини­дисков.

Современные аудиокарты поддерживают также ряд стандартных возможностей моделирования, генерации и обработки звукового сигнала:

  • DirectX  предложенная Microsoft система команд управления позиционированием виртуального звукового источника (мо­дификации  DirectX 3, 5, 6);

  • A3D  разработанный в 1997 г. NASA (National Aeronautics and Space Administration) и Aureal для использования в летных тренажерах стандарт генерации таких эффектов, как густой ту­ман или подводные звуки. A3D2 позволяет моделировать кон­фигурацию помещения, в котором раздаются и распространя­ются звуки, вычисляя до 60 звуковых отражений (как в ангаре, так и в колодце);

  • ЕАХ (Environmental Audio Extensions), предложенная Creative Technology в 1998 г. модель добавления реверберации в A3D с учетом звуковых препятствий и поглощения звуков;

  • MIDI (Musical Instrument Digital Interface), разработанный в 1980-х гг. Команды по стандартному интерфейсу передаются в соответствии с MIDI-протоколом. MIDI-сообщение содержит не запись музыки как таковой, а ссылки на ноты. В частности, когда звуковая карта получает подобное сообщение, оно рас­шифровывается (какие ноты каких инструментов должны зву­чать) и отрабатывается в синтезаторе. В свою очередь, ПК мо­жет через интерфейс MIDI управлять различными «интерак­тивными» инструментами. В Windows MIDI-файлы могут воспроизводиться специальной программой-проигрывателем MIDI-Sequencer. В этой области синтеза звука также имеется свой стандарт. Основным является стандарт МТ-32, разрабо­танный фирмой Roland и названный в соответствии с одно­именным модулем генерации звуков. Этот стандарт также применяется в звуковых картах LAPC и определяет основные средства для управления расположением инструментов, голо­сов, а также для деления на инструментальные группы (кла­вишные, ударные и т. д.).

Формат сжатия звука МРЗ. Разработанный на основе исходно­го MPEG-1 стандарт МРЗ (сокращение от аудиоМРЕG, уровень 3) является одной из трех схем кодирования (Layer (уровень) I, Layer II и Layer III) для сжатия аудиосигналов. Общая структура процесса кодирования одинакова для всех уровней. Для каждого уровня определен свой формат записи битового потока и свой ал­горитм декодирования. Алгоритмы MPEG основаны в целом на изученных свойствах восприятия звуковых сигналов слуховым ап­паратом человека (т. е. кодирование производится с использовани­ем так называемой «психоакустической модели»). Поскольку чело­веческий слух не идеален и восприимчивость слуха на разных час­тотах, в разных композициях различная, этим пользуются при построении психоакустической модели, которая учитывает, какие звуки, частоты, можно исключить, не нанося ущерба слушателю композиции.

Входной цифровой сигнал сначала раскладывается на частотные составляющие спектра. МРЗ-стандарт делит спектр частоты на 576 полос частоты и сжимает каждую полосу независимо. Затем этот спектр очищается от заведомо неслышных составляющих  низко­частотных шумов и наивысших гармоник, т. е. фильтруется. На сле­дующем этапе производится значительно более сложный психоаку­стический анализ слышимого спектра частот. Это делается в том числе с целью выявления и удаления «замаскированных» частот (частот, которые не воспринимаются слухом ввиду их приглушения другими частотами). Если два звука происходят в одно и то же вре­мя, МРЗ делает запись только того, который будет фактически вос­принят. Тихий звук немедленно после громкого также может быть удален, так как ухо адаптируется к громкости. Если звук идентичен на обоих каналах стерео, этот сигнал сохраняется 1 раз, но воспро­изводится на обоих каналах, когда МРЗ-файл декомпрессирован и озвучивается.

Затем, в зависимости от уровня сложности используемого алго­ритма, может быть также произведен анализ предсказуемости сиг­нала. В довершение ко всему проводится сжатие уже готового бито­вого потока упрощенным аналогом алгоритма Хаффмана (Huffman), что позволяет также значительно уменьшить занимаемый потоком объем.

Как было указано выше, стандарт MPEG-I имеет три уровня (Layer I, II и III). Эти уровни различаются по обеспечиваемому ко­эффициенту сжатия и качеству звучания получаемых потоков. Layer I позволяет сигналы 44,1 кГц/16 бит хранить без ощутимых потерь качества при скорости потока 384 Кбит/с, что составляет 4-кратный выигрыш в занимаемом объеме; Layer II обеспечивает такое же качество при 194 Кбит/с, a Layer III  при 128. Выигрыш Layer III очевиден, но скорость компрессии при его использовании самая низкая (надо отметить, что при современных скоростях про­цессоров это ограничение уже незаметно).

Системы воспроизведения звукового окружения. Воспроизведение звукового окружения начиналось со стереозаписей и УКВ ЧМ-радио. Широко использовались магнитофоны и FM-стереотюнеры с высококачественным двухканальным звуком. В кинотеатрах зрители могли оценить звук в формате Dolby Stereo Optical. Первые видео­кассеты предполагали только монофонический звук посредственно­го качества, однако вскоре начали тиражироваться кассеты с двух­канальным звуком. Сначала использовались просто раздельные зву­ковые дорожки, затем технология Hi-Fi. Лазерные диски с самого начала выпускались с двухканальным стереозвуком высокого каче­ства. Вскоре и большинство стандартов вещательного телевидения были адаптированы для передачи видео с двухканальным звуковым сопровождением в эфире и в кабеле. Так популярный двухканальный формат звука стал тривиальной опцией домашнего видео. Пер­выми на рынке появились простые декодеры Dolby Surround, кото­рые позволяли на домашней аппаратуре выделить и прослушать тре­тий, пространственный канал  surround channel. Впоследствии был разработан более интеллектуальный декодер, Dolby Surround Pro Logic, который выделял и центральный канал  center channel. По­лучился «домашний кинотеатр»  комплекс аппаратуры для высо­кокачественного воспроизведения звука и видео с декодером Dolby Pro Logic Surround Sound (рис. 6.8).

В отличие от аппаратуры квадро, аппаратура Dolby Surround производилась и производится в массовых масштабах и постоянно совершенствуется. Во-первых, технология Dolby Pro Logic удачно совмещает оптимальную конфигурацию пространственных каналов (R, L, С, S) с возможностями записи и передачи (два физических канала), которыми обладает практически вся бытовая аппаратура. Во-вторых, возможности и качество Dolby Pro Logic отвечают ак­туальным требованиям современного пользователя. И, в-третьих, используются единые стандарты на аппаратные и программные средства.

Кодер Dolby Surround не предназначен для передачи четырех независимых сигналов звука, каждый из которых надо прослуши­вать раздельно (например, звука одной ТВ-программы на разных языках). В этом случае развязка между двумя любыми каналами должна была бы быть максимальной, а амплитуды и фазы сигналов могли бы быть совершенно не связаны между собой. Напротив, за­дача Dolby Surround  передать четыре канала звука (soundtrack), которые будут прослушиваться одновременно и при этом воссозда­вать в сознании слушателя пространственную звуковую картину (soundfield). Эта картина составляется из нескольких звуковых обра­зов (sound images)  звуков, которые слушатель воспринимает свя­занными со зрительными образами на экране. Звуковой образ ха­рактеризуется не только содержанием и мощностью звука, но и на­правлением в пространстве.

На входе кодера Dolby Surround присутствуют сигналы четырех каналов  L, С, R и S, а на выходах  два канала Lt (left total) и Rt (right total). Слово «total» (общий) означает, что каналы содержат не только «свой» сигнал (левый и правый), но и кодированные сигна­лы других каналов  С и S. Функциональная схема кодера показана на рис. 6.9.

Сигналы каналов L и R передаются на выходы Lt и Rt без ка­ких-либо изменений. Сигнал канала С делится поровну и складыва­ется с сигналами каналов Lt и Rt. Предварительно сигнал С ослабля­ется на 3 дБ (чтобы сохранить неизменной акустическую мощность сигнала после сложения его «половинок» в матрице декодера). Сиг­нал канала S также ослабляется на 3 дБ, но, кроме того, перед сложением с сигналами Lt и Rt он подвергается следующим преобразо­ваниям:

  • полоса частот ограничивается полосовым фильтром (BPF) от 100 Гц до 7 кГц;

  • сигнал обрабатывается шумоподавителем  процессором Dolby B-type Noise Reduction;

  • сигнал S сдвигается по фазе на +90 и - 90 град., таким обра­зом, составляющие сигнала S, предназначенные для сложения с Lt и Rt оказываются в противофазе друг с другом.

Совершенно ясно, что сигналы L и R не влияют друг на друга, они совершенно независимы. На первый взгляд не столь очевидно, но факт  между сигналами С и S развязка теоретически также иде­альная. Действительно: в декодере сигнал S получается как разность сигналов Lt и Rt. Но в этих сигналах присутствуют совершенно оди­наковые компоненты сигнала С, которые при вычитании взаимно компенсируются. Напротив, сигнал С выделяется декодером, как сумма Lt и Rt. Так как компоненты сигнала S, присутствующие в этих сигналах, находятся в противофазе, при сложении они также взаимно компенсируются.

Такое кодирование позволяет передать сигналы S и С с высокой степенью развязки при одном условии: если амплитудные и фазо­вые характеристики физических каналов, по которым передаются сигналы Lt и Rt абсолютно идентичны. Если имеется некоторый дисбаланс между каналами, развязка уменьшается. Например, если компоненты сигнала С в каналах Rt и Lt из-за разных характеристик каналов передачи окажутся неодинаковыми, произойдет нежела­тельное проникновение (crosstalk) части сигнала С в канал S.