
- •5 Введение
- •Глава 1
- •1.1. Информатика — состав и структура
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.3. Структуризация взаимосвязи информатики с предметной областью применения
- •1.4. Уровни информационных процессов
- •Глава 2
- •2.1. Текстовая информация. Модель документа
- •2.2. Языки разметки документов
- •2.3. Технологии xml
- •2.4. Текстовый редактор Word
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 3
- •3.2. Форматы записи-воспроизведения аудиосигналов
- •3.3. Технологии статических изображений
- •3.4. Программные средства обработки изображений
- •3.5. Цифровое видео
- •Глава 4
- •4.1. Оптическое распознавание символов (ocr)
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 5
- •5.2. Базы данных и субд
- •Логический файл
- •Логический файл
- •Очереди
- •Время установки головок чтения-записи
- •5.4. Анализ информации и хранилища данных
- •Глава 6
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
- •Глава 7
- •Глава 8
- •Глава 1 5
- •5.3. Физическая организация данных в системах управления данными 296
Глава 3
МУЛЬТИМЕДИЙНЫЕ ТЕХНОЛОГИИ
Мультимедиа — совокупность программно-аппаратных средств, реализующих интегрированную обработку и представление информации в символьном, звуковом и зрительном виде. Мультимедиа представляет собой объединение нескольких способов подачи информации — текст, неподвижные изображения (рисунки и фотографии), движущиеся изображения (мультипликация и видео) и звук (цифровой и MIDI) в интерактивный продукт.
Появление систем мультимедиа, безусловно, производит большие изменения в таких областях, как образование, компьютерный тренинг, во многих сферах профессиональной деятельности, науки, искусства, в компьютерных играх и т. д.
Поскольку технические средства мультимедиа и их характеристики более подробно описываются, например, в [25], здесь мы ограничимся рассмотрением некоторых методов представления и обработки информации в таких системах.
3.1. Обработка аудиоинформации
В то время как даже в нецифровых технологиях фото и видео в принципе могут быть найдены элементы дискретности (в первом случае зерна пленки и фоточувствительные ячейки иконоскопа или матрица ПЗС, во втором — то же плюс разбиение изображения на строки), звуковой сигнал в своей основе является чисто аналоговым (если не вдаваться в такие тонкости, как магнитные домены в чувствительном слое при записи на ленту). Поэтому целесообразно здесь сказать несколько слов о преобразовании звука (аналог—код и обратно).
Аналого-цифровое преобразование
Аналого-цифровое (дискретное) преобразование (АЦП) — (ADC — analog-to-digital conversion) — заключается в формировании последовательностей «-разрядных двоичных слов, представляющих с заданной точностью аналоговые сигналы. В необходимых случаях осуществляется обратное — дискретно-аналоговое (цифроаналоговое преобразование — ЦАП, DAC^.
Более чем тридцатилетнее развитие теории и практики ЭВМ приводит к вытеснению (в том числе и на бытовом уровне) аналоговых устройств и сигналов цифровыми. Наиболее популярным примером является несомненно а у диоком пакт-диск (digital audio CD) [25].
В этом случае звуковой сигнал (рис. 3.1) сначала преобразуется в дискретную аппроксимацию («многоуровневый ступенчатый сигнал»), при этом происходит квантование по времени, которое заключается в измерении (sampling) в дискретные моменты необходимого параметра аналогового сигнала.
При квантовании по амплитуде каждая ступенька представляется последовательностью бинарных цифровых сигналов. Принятый в настоящее время стандарт CD использует так называемый «16-разрядный звук с частотой сканирования 44 кГц».
Для рис. 3.1 в переводе на нормальный язык это означает, что «длина ступеньки» (т) равна '/44100 с, а «высота ступеньки» (5) составляет '/65 536 максимальной громкости сигнала (поскольку 216 = 65 536). При этом частотный диапазон воспроизведения составляет 0—22 кГц, а динамический диапазон — 96 децибел (что
Рис.
3.1.
Аналоговый сигнал (/) и его дискретная
(цифровая) аппроксимация
(2) (оцифровка);
т — период дискретизации (sampling
rate); 5
— уровни квантования
по
амплитуде
составляет совершенно недостижимую для магнитной или механической звукозаписи характеристику качества). Необходимо заметить, что различные звуковые карты могут обеспечить 8- или 16-битные выборки, 8-битные карты позволяют закодировать 256 различных уровней дискретизации звукового сигнала, соответственно 16-битные — 65 536 уровней.
Количество выборок в секунду, т. е. частота дискретизации аналогового звукового сигнала, также может принимать различные значения: 5,5, 11, 22 и 44 кГц. Таким образом, качество звука в дискретной форме может быть очень плохим (качество радиотрансляции) при 8 битах и 5,5 кГц и очень высоким (качество аудиоСБ) при 16 битах и 44 кГц.
Поскольку компакт-диск — стереосистема, необходимо записывать два 16-разрядных слова каждый 44 100 раз в секунду. Это удается в пределах 176,4 Кбайт/с, 10,58 Мбайт/мин или 635 Мбайт/ч. Самый распространенный формат файла цифровой звукозаписи на ПК — WAV.
Для записи звука к звуковой плате может быть подключен микрофон или устройство воспроизведения звука (магнитофон, CD-плейер). Для воспроизведения звука к ее выходу могут быть подключены акустические колонки или наушники, а также любая акустическая система (магнитофон, музыкальный центр и т. д.).
Запись и редактирование аудиоматериалов требует большое пространство жесткого диска — при качестве компакт-диска звучание 10 мин потребует более чем 100 Мбайт. Чем быстрее диск и подсистема ввода-вывода, тем легче работать с такими большими файлами. Современные жесткие диски и РС1-контролле- ры способны к поддержке передачи не менее 4 Мбайт/с. Необходимы гарантии, чтобы не было никаких прерываний в аудиопотоке. Многие НЖМД делают прерывание, чтобы выполнить тепловую перекатибровку, которое может привести к короткой, но нежелательной паузе в звуке. Некоторые дисководы AV специально проектируются без тепловой перекалибровки, таким образом устраняя этот эффект.
Звуковые платы
Звуковая плата ПК содержит несколько аппаратных систем, связанных с производством и сбором аудиоданных, две основные аудиоподсистемы, предназначенные для цифрового «аудио- захвата», синтеза и воспроизведения музыки (рис. 3.2). Исторически подсистема синтеза и воспроизведения музыки генерирует звуковые волны одним из двух способов:
через внутренний синтезатор (например, ЧМ-синтезатор);
проигрывая оцифрованный (sampled) звук.
Секция цифровой звукозаписи звуковой платы состоит из пары 16-разрядных преобразователей — ЦАП и АЦП и содержит программируемый генератор частоты выборки, синхронизирующий преобразователи и управляемый от ЦП. Компьютер передает оцифрованные звуковые данные к преобразователям или обратно. Частота преобразования обычно кратна (или составляет часть от) 44,1 кГц.
Большинство плат использует один или более каналов прямого доступа к памяти, некоторые платы также обеспечивают прямое цифровое подключение S/PDIF (или SPDIF). Кабель передачи SPDIF (Sony/Philips Digital InterFace — Цифровой Интерфейс Sony/Philips) может быть оформлен в двух видах: коаксиальный и оптический. Входы и выходы коаксиального SPDIF выполнены на разъемах типа RCA. Оптический SPDIF использует для передачи данных оптический кабель, входы и выходы которого выполнены на разъемах типа Toslink.
Генератор звука, установленный на плате, использует процессор цифровых сигналов (Digital Signal Processor — DSP), который проигрывает требуемые музыкальные ноты, объединяя их считывание из различных областей звуковой таблицы с различными скоростями, чтобы получить требуемую высоту тона. Максимальное количество доступных нот связано с мощностью DSP-процессора и называется полифонией платы.
DSP-процессоры используют сложные алгоритмы, чтобы создать эффекты наподобие реверберации, хорового звучания и запаздывания. Реверберация создает впечатление, что инструменты играют в больших концертных залах. Хор используется, чтобы создать впечатление, что несколько инструментов играют совместно, тогда как фактически есть только один. Добавление запаздывания к партии гитары, например, может дать эффект пространства и стереозвучания.
Частотная модуляция. Первой широко распространенной технологией, которая используется в звуковых платах, была частотная модуляция (ЧМ, Frequency Modulation — FM), разработанная в начале 1970-х гг. Дж. Чоунингом (Стэнфордский университет).
Синтез с использованием частотной модуляции (FM-synthesis) основывается на последовательном и параллельном подключении генераторов простых сигналов и их взаимомодуляции. Схема соединения генераторов и параметры каждого сигнала (частота, амплитуда и закон их изменения во времени) определяют тембр звучания, а количество генераторов и степень тонкости управления ими определяет предельное количество синтезируемых тембров. Данный метод очень удобен с точки зрения дешевизны реализации, но при этом требует сложного программирования и тонкой настройки. Использовался в большинстве звуковых PC-карт в виде стандартных GM-устройств, а также активно популяризировался фирмой Yamaha и ее модельным рядом синтезаторов GX.
Каждый голос ЧМ-синтезатора требует минимум двух генераторов сигнала, обычно называемых «операторами». Различные конструкции ЧМ-синтезатора имеют различные степени управления параметрами оператора. Сложные системы ЧМ могут использовать 4 или 6 операторов на каждый голос, и операторы могут иметь корректируемые параметры, которые позволяют настроить скорости нарастания и угасания сигнала.
Yamaha была первой компанией, которая вложила капитал в исследования по теории Чоунинга, что привело к разработке легендарного синтезатора DX7. Специалисты Yamaha скоро поняли, что смешивание более широкого диапазона несущих и модуляторов позволяет создать более сложные тембры, приводя к более реалистическим звучащим инструментам. Аппаратные средства их синтезатора OPL3 — фактический стандарт для игровых плат, использует параметры, загруженные программным драйвером, чтобы управлять каскадными генераторами ЧМ, которые создают аналог акустических и электронных музыкальных инструментов.
Хотя системы ЧМ были осуществлены в аналоговом исполнении на ранних клавиатурных синтезаторах, в дальнейшем выполнение синтеза FM было сделано в цифровой форме. Методы синтеза FM очень полезны для того, чтобы создать выразительные новые звуки. Однако если цель синтезирующей системы состоит в том, чтобы воспроизвести звук некоторого существующего инструмента, это лучше делать в цифровой форме на основе выборок сигналов, как при синтезе с использованием звуковых таблиц (WaveTable Synthesis).
Табличный синтез (WaveTable synthesis или PCM-svnthesis). Здесь используются выборки звуков реальных инструментов — небольших сэмплированных «кусочков» звуковой волны, определенный набор которых позволяет создать звучание инструмента, смоделировать интересные звуки. Активно используется в PPG, Waldorf, Korg DW-8000, Ensoniq ESQ-1 и ряде других синтезаторов.
Выборка — цифровое представление формы звука, произведенного инструментом. Платы, использующие ISA, обычно сохраняют выборки в ROM. хотя более новые PCI-изделия используют основную системную оперативную память ПК, которая загружается при запуске ОС (например, Windows) и может включить новые звуки.
В то время как все звуковые платы ЧМ звучат аналогично, платы звуковых таблиц значительно отличаются по качеству. Качество инструментов определено несколькими факторами:
качество первоначальной записи;
частота, на которой выборки были записаны;
количество выборок, использованных для каждого инструмента;
методы сжатия, использованные для сохранения выборки.
Большинство инструментальных выборок записаны в стандарте 16 бит и 44,1 кГц, но многие изготовители сжимают данные так, чтобы больше выборок или инструментов можно было записать в ограниченный объем памяти. Однако сжатие часто приводит к потере динамического диапазона или качества.
Когда аудиокассета воспроизводится слишком быстро или слишком медленно, ее высота звучания меняется, и это справедливо также для цифровой звукозаписи. Проигрывание выборки на более высокой скорости, чем ее оригинал, приводит к более высокому воспроизводимому звуку, позволяя инструментам исполнять более чем несколько октав. Однако если некоторые тембры воспроизводятся быстро, они звучат слишком слабо и тонко; аналогично, когда выборка проигрывается слишком медленно, она звучит уныло и неестественно. Чтобы преодолеть эти эффекты, изготовители разбивают клавиатуру на несколько областей и применяют различные выборки звуков инструментов в каждой из них.
Каждый инструмент звучит с различным тембром в зависимости от стиля игры. Например, при мягкой игре на фортепьяно, не слышен звук молотков, бьющих по струнам. При более интенсивной игре мало того, что этот звук становится более очевидным, но можно заметить также и изменения тона.
Для каждого инструмента должны быть записаны много выборок и их разновидностей, чтобы синтезатор точно воспроизвел соответствующий диапазон звука, а это неизбежно требует большего количества памяти. Типичная звуковая плата может содержать до 700 инструментальных выборок в пределах ROM 4 Мбайт. Точное воспроизведение фортепьяно соло, однако, требует от 6 до 10 Мбайт данных, вот почему нет никакого сравнения между синтезируемым и реальным звуком.
Обновление звуковой таблицы не всегда означает необходимость покупать новую звуковую плату. Большинство 16-разрядных звуковых плат имеет разъем, который может соединиться с дополнительной платой звуковой таблицы (daughterboard). Качество звучания инструментов, которые такие платы обеспечивают, значительно отличается, и это обычно зависит от того, каков объем памяти расположен на плате. Большинство плат содержит между 1-й 4 Мбайт выборок, и предлагает целый ряд цифровых звуковых эффектов.
Другие методы звукового синтеза.
Аддитивный или суммирующий синтез (additive synthesis). Данный метод прекрасно иллюстрируют первые модели от Hammond, которые были основаны на принципе построения звучания реальных органов. В его основе лежит следующая идея — создание сложных гармонически насыщенных звуков из простых изменяющихся синусоидальных волн, различных по амплитуде и/или частоте.
Вычитающий синтез (subtractive synthesis). Данный метод противоположен предыдущему. В качестве исходного берется тембрально богатый, насыщенный гармониками звук, а потом в результате сложной фильтрации из него формируется определенный тембр с характерной тоновой окраской.
Direct Draw. В ряде синтезаторов используются осцилляторы, генерирующие звуковые волны со стандартными формами (синусоида, прямоугольная, пилообразная и т. п.). В варианте Direct Draw пользователь может самостоятельно рисовать любые формы.
Гранулированный синтез (Granular synthesis). Является частным случаем таблично-волнового синтеза. Звук формируется из коротких сэмплированных фрагментов звуковой волны. В результате взаимодействия частоты их повторения и частотных составляющих сэмплированной звуковой формы получается тембрально сложный монотонный звук, который впоследствии можно обрабатывать методами вычитающего синтезирования. Одна из первых реатизашш подобного была в программе Ross Bencina AudioMulch.
Сэмпл инг (Sample playback). Данный метод базируется на использовании сэмплированных (записанных) инструментов и воспроизведении их в режиме обычного проигрывателя. Небольшие звуковые фрагменты, из которых складывается звучание инструмента, загружаются в память (ROM или RAM) и затем воспроизводятся.
Р е с и н т е з и р о в а н н ы й PCM (Resynthesized (RS) -— PCM). Этот метод синтеза был введен фирмой Roland и основан на анализе сэмплированного звука и его последующего воссоздания аддитивным методом синтеза.
JI и н е й н о - а р и ф м е т и ч е с к и й синтез (Linear/Arithmetic (L/A) synthesis). Этот метод также был введен фирмой Roland в конце 80-х гг., начиная с модели D-50. За основу концепции L/A synthesis было взято смешивание небольшого фрагмента сэмпла «живого» инструмента (обычно атаки) с синтезированной волновой формой. Этот метод позволяет дать натуральную звуковую окраску, близкую к реальному звучанию, при этом получается выигрыш в меньшей загрузке аппаратных вычислительных мощностей. Атака инструмента — это один из самых сложных элементов при реализации натуральных звуков в синтезированном виде.
Передовое интегрирование (Advanced Integrated synthesis). Данный метод был впервые представлен в модели Korg М-1. Он использует сэмплированную атаку и другие волновые формы, которые впоследствии обрабатываются методами вычитающего синтеза, при этом для получения качественно новых звуков дополнительно могут использоваться сложные эффект-процессоры.
Синтез переменной архитектуры (VAST — Variable Architecture Synthesis Technology). Разновидность DSP-синтеза, основанная на комбинировании мощных вычислений по формированию пэтчей, включая сэмплированные звуки, добавление сложных эффектов и открытую архитектуру.
Z-Plane synthesis. Данный метод синтезирования является уникальной разработкой и впервые был представлен в звуковом модуле E-mu Systems Morpheus. Его суть состоит в еле- дующем — берутся две волновые формы разных инструментов и одна промежуточная для плавного перетекания от первой ко второй.
Синтез физического моделирования (Physical modeling synthesis). За основу данного метода берется сложная математическая модель, которая полностью описывает формирование звука в инструменте. Впервые этот вид синтезирования был представлен в модельном ряде синтезаторов Yamaha VL-1 и VL-7, а теперь используется повсеместно, хотя до полноценного математического повторения реальных физических процессов еще далеко.
Синтез по математической функции (Mathematical function synthesis). Также частный случай физического моделирования, с помощью которого можно вкладывать математические функции, объединять их в функциональные блоки, а из них создавать математические алгоритмические модели. Вернее сказать, что этот метод является одним из простейших разделов физического моделирования. Он хорошо подходит для эмуляции аналоговых синтезаторов.
Спектральный синтез (Spectral synthesis). Это даже не метод, а скорее способ создания сложных гармонических звуков. За основу их построения берется обыкновенная спектрограмма (графическое представление зависимости частоты от амплитуды).
Плата SoundBlaster
В 1998 г. Creative Technology был выпушен удачный образец звуковой платы SoundBlaster Live!, ставший в дальнейшем стандартом де-факто.
Версия Platinum 5.1 карты Creative SoundBlaster Live!, которая появилась к концу 2000 г., имела следующие гнезда и соединители (рис. 3.2):
аналогово-цифровой выход — либо сжатый сигнал в формате Dolby АС-3 SPDIF с 6 каналами для подключения внешних цифровых устройств или динамиков цифровых систем, либо аналоговая система громкоговорителей 5.1;
линейный вход — соединяется с внешним устройством типа кассетного, цифрового магнитофона, плейера и пр.;
-Микрофон вход
- АудиоСР
Телефонный автоответчик Внешний коннектор
ровои звук) I /
ft
Линейный Линейный (микрофон) (микрофон) вход 2 вход 2 MIDI вход-выход селектор
Аудиорасширение (цифровой ввод-вывод)
Линейный выход
а б
Рис. 3.2. Схема аудиоплаты The Platinum 5.1 Creative
Разъемы Оптический SPDIF rqa (цифровой звук)
Инфракрасный порт
ЩЩ
микрофонное гнездо — соединяется с внешним микрофоном для ввода голоса;линейный выход — соединяется с динамиками или внешним усилителем для аудиовывода или наушниками;
соединитель джойстика/MIDI — соединяется с джойстиком или устройством MIDI; и может быть настроен так, чтобы соединяться с обоими одновременно;
CD/SPDIF-соединитель — соединяется с выводом SPDIF, расположенным на дисководе DVD или CD-ROM;
дополнительный аудиовход — соединяется с внутренними аудиоисточниками типа тюнера, MPEG или других подобных плат;
соединитель аудиоСО — соединяется с аналоговым аудио- выводом на CD-ROM или DVD-ROM, используя кабель аудиоСО;
соединитель автоответчика — обеспечивает монофоническую связь со стандартным голосовым модемом и передает сигналы микрофона к модему.
Аудиорасширение (цифровой ввод-вы вод) — соединяется с цифровой платой ввода-вывода (может располагаться в свободной нише накопителя на 5,25", выходящей на переднюю панель компьютера), иногда называемой Live!Drive. Обеспечивает следующие соединения:
гнездо RCA SPDIF — соединяется с устройствами цифровой звукозаписи типа цифровой ленты и мини-дисков;
гнездо наушников — соединяется с парой высококачественных наушников; вывод динамика отключается;
регулировка уровня наушников — управляет громкостью сигнала наушников;
второй вход (линейный/микрофонный) — соединяется с высококачественным динамическим микрофоном или ау- диоисточником (электрогитара, цифровое аудио или минидиск);
переключатель второго входа (линейный/микрофон);
соединитель MIDI — соединяется с устройствами MIDI через кабель Mini DIN-Standard DIN;
инфракрасный порт (сенсор) — позволяет организовать дистанционное управление ПК;
вспомогательные гнезда RCA — соединяются с оборудованием бытовой электроники типа видеомагнитофона, телевизора или проигрывателя компакт-дисков;
оптический вход/выход SPDIF — соединяется с устройствами цифровой звукозаписи наподобие цифровой ленты или мини-дисков.
Другие изготовители звуковых плат быстро восприняли идею относительно отдельного модуля разъемов ввода-вывода. Было разработано множество разновидностей — одни были размешены в отсеке для накопителей подобно LivelDrive, другие были внешними модулями, некоторые из которых были разработаны, чтобы действовать как концентраторы USB.
Современные аудиокарты поддерживают также ряд стандартных возможностей моделирования, генерации и обработки звукового сигнала:
DirectX — предложенная Microsoft система команд управления позиционированием виртуального звукового источника (модификации — DirectX 3, 5, 6);
A3D — разработанный в 1997 г. NASA (National Aeronautics and Space Administration) и Aureal для использования в летных тренажерах стандарт генерации таких эффектов, как густой туман или подводные звуки. A3D2 позволяет моделировать конфигурацию помещения, в котором раздаются и распространяются звуки, вычисляя до 60 звуковых отражений (как в ангаре, так и в колодце);
ЕАХ (Environmental Audio Extensions) — предложенная Creative Technology в 1998 г. модель добавления ревербера- ций в A3D с учетом звуковых препятствий и поглощения звуков;
• MIDI (Musical Instrument Digital Interface) — протокол, разработанный в 1980-х гг., в соответствии с которым команды передаются по стандартному интерфейсу. В Windows MIDI-файлы могут воспроизводиться специальной программой-проигрывателем MIDI-Sequencer. В этой области синтеза звука также имеются свои стандарты. Основным является стандарт МТ-32. разработанный фирмой Roland и названный в соответствии с одноименным модулем генерации звуков. Этот стандарт также применяется в звуковых картах LAPC и определяет основные средства для управления расположением инструментов, голосов, а также для деления на инструментальные группы (клавишные, ударные и т. д.) (рис. 3.3).
Рис.
3.3. MIDI-ингерфейс
MIDI
Цифровой -интерфейс музыкальных инструментов (Musical Instrument Digital Interface или MIDI) появился в начале 1980-х гг. и был разработан, чтобы обеспечить стандартный интерфейс между пультами управления музыкой (наподобие клавиатур) и звуковыми генераторами (типа синтезаторов и «роботов-барабаншиков»). Кроме того, он первоначально был предназначен для работы через последовательное подключение, аналогичное стыку RS-232 [24. 251. и включал в себя как стандарт передачи информации, так и протокол электрических сигналов.
На уровне электросигналов MIDI представляет полудуплексную токовую петлю (5 мА). которая пропускает последовательный поток данных по 8 битов на скорости передачи 31,25 килобод.
На уровне передачи информации VIIDI представляет собой что-то вроде языка для того, чтобы описать музыкальные такты и эффекты в реальном масштабе времени. Он обеспечивает соединение более чем по 16 каналам, позволяя подключить до 16 инструментов MIDI к одному интерфейсу. Некоторые MIDI-интерфейсы имеют 16 выходов, позволяя одновременно обращаться к 256 инструментам.
Интерфейс MIDI передает не звук, а команды, которые выполняет устройство-приемник. Инструменты соединяются стандартными разъемами 5-DIN. Например, если на клавиатуре нажата определенная клавиша, то передается команда Note On (включить ноту), которая заставляет принимающее устройство проиграть некоторую музыкальную ноту.
Команда состоит из трех элементов:
байт состояния (Status Byte);
номер ноты (Note Number) ;
значение скорости нажатия клавиши (Velocity Value).
Байт состояния содержит информацию о типе команды
(в этом случае — «включить ноту»), а также на какой канал она должна быть послана (1 — 16).
Номер ноты описывает клавишу, которая была нажата (скажем, «ре» Большой Октавы).
Значение скссссгх указывает силу, с которой эта клавиша была нажата. Принимающий инструмент будет исполнять эту ноту, пока не придет команда Note Off (отключить ноту), которая содержит аналогичные данные.
В зависимости от того, какой именно звук проигрывается, синтезаторы по-разному обрабатывают данные Velocity Value. Звук фортепьяно, например, становится громче, если клавиша нажата более сильно, а также изменяются тональные свойства. Профессиональные синтезаторы часто вводят дополнительные тембры, чтобы подражать звуку молоточков, ударяющих по струнам.
Число голосов (MIDI-каналов) или полифония звуковой платы определяет максимальное количество элементарных звуков, которые плата может воспроизвести одновременно. Это число иногда указывают в названии звуковой карты, например: SB 16, AWE 64, SB PCI 64. SB PCI 128 и т. д.
Существует несколько разновидностей стандарта MIDI — (£м, GS и т. л. Практически все современные звуковые адаптеры совместимы со стандартом GM (General MIDI — единый или общий MIDI).
Постоянные контроллеры Continuous Controllers (СС) используются, чтобы управлять параметрами настройки: уровень звучания, эффекты, панорамирование (позиционирование стереозвука) и др. Многие устройства MIDI позволяют установить внутренние параметры для СС (до 128). На этой базе Ассоциация Изготовителей MIDI (MIDI Manufacturers Association — MMA) разработала спецификацию для синтезаторов, известную как General MIDI.
MIDI секвенсоры. Первые приложения MIDI были рассчитаны на то, чтобы при игре на одной клавиатуре сочетать звуки, произведенные несколькими синтезаторами. Сегодня тем не менее это используется главным образом в секвенсорах, хотя MIDI также применяется и в системах театрального освещения и сопровождения как удобный способ управления множеством прожекторов и кино (видео) проекторов.
По существу, секвенсор (sequencer) представляет собой цифровой магнитофон, который записывает и воспроизводит команды MIDI, а не аудиосигналы. Первые секвенсоры имели небольшую память и были способны к запоминанию только от 1 до 2 тыс. музыкальных тактов. С развитием секвенсоров совершенствовались и системы MIDI. Не ограничиваясь только проигрыванием нот в MIDI, изготовители разработали способы управления индивидуальными звуковыми параметрами и встроенными цифровыми эффектами, используя постоянные контроллеры (СС). Большинство программ-секвенсоров — приложения на основе ПК, и имеют возможности корректировать эти параметры, используя графические слайдеры. Более того, имея обширный перечень возможностей редактирования и настройки музыкальных тактов, вовсе не нужно быть опытным исполнителем-вша- вишником, чтобы создавать хорошую музыку.
Использование секвенсоров позволяет удобно редактировать музыкальные фразы и синхронизировать их с фильмом. При этом обеспечиваются экономичные возможности для разработчиков мультимедиа, предоставляющие слушателям высококачественный звук. Для записи оцифрованной музыки требуется не менее 10 Мбайт/мин, в то время как данные MIDI требуют только малую долю от этого.
Сэмплер — синтезатор, у которого для хранения образцов звучания (сэмплов) вместо постоянной памяти (ROM) используется оперативная память большого объема (RAM). Пользователь перед каждым сеансом работы загружает в память уже готовые звуки, или записывает новые звуки точно так же, как на обычный магнитофон. Впоследствии все эти сэмплы воспроизводятся с разной высотой под управлением клавиатуры или секвенсора. Для изменения высоты тона сэмплов используются такие же алгоритмы, как и в программах типа Sound Forge, только они действуют в реальном времени.
При формировании звуков в сэмплерах не используются алгоритмы компрессии, которые, например, позволяют «упаковать» в 4 Мбайт ROM 250—400 звуков разного тембра, как это происходит в синтезаторах. Кроме этого, синтезаторы ограничены тем набором звуков, который находится в ROM, а для сэмплеров выпускается огромное количество библиотек звуков на компакт-дисках, поэтому можно, имея всего лишь одно устройство, практически безгранично расширять его возможности.
Помимо всех перечисленных достоинств, сэмплеры имеют одну очень важную черту — пользователь может создавать звук самостоятельно от первого до последнего шага.
В сэмплере каждый звук создается в нескольких источниках, сигналы которых смешиваются между собой. Каждый такой источник принято называть леером (от англ. layer — слой). Главным элементом любого леера является генератор — именно в нем образуется звук при воспроизведении сэмпла. Иногда генератор сэмплера называют осциллятором. Сэмплы находятся в оперативной памяти устройства и извлекаются оттуда при поступлении соответствующей команды от программы управления.
Генератор воспроизводит сэмпл с разной высотой, в зависимости от поступающей в него команды MIDI Note (MIDI нота). Причем, сэмпл может воспроизводиться как линейно, т. е. от начала до конца, так и зацикливаться. В последнем случае инструмент звучит ровно столько, сколько времени удерживается в нажатом состоянии клавиша на MIDI-клавиатуре. Помимо изменения высоты тона, генератор изменяет уровень воспроизводимого сэмпла в зависимости от сообщения Velocity (Скорость нажатия клавиши).
В сэмплере с помощью генератора низкой частоты (LFO — Low Frequency Oscillator) можно менять высоту воспроизведения сэмпла с некоторой периодичностью. Но в отличие от программного FM-синтезатора, частотой колебаний LFO сэмплера можно управлять в реальном времени с помощью MIDI-клавиа- туры.
Амплитудой колебаний LFO можно управлять с помощью генератора огибающей (Envelope Generator), создающего произвольную огибающую. Этот метод называется амплитудной модуляцией (AM — Amplitude Modulation). Но в любом сэмплере с помощью амплитудной модуляции можно управлять не только параметрами генератора низкой частоты, но и параметрами воспроизведения сэмпла. Например, если указано «время линейной атаки» 1 с, то после нажатия клавиши громкость сэмпла будет линейно возрастать от минимальной громкости к максимальной в течение 1 секунды. Если указывается время затухания (Release) 0,5 с, то после отпускания клавиши сэмпл будет звучать указанное время, причем его громкость будет линейно уменьшаться. Естественно, можно «нарисовать» и более сложные огибающие.
К сэмплу, который воспроизводится генератором с разной высотой и уровнем в зависимости от поступающих с клавиатуры команд MIDI Note (MIDI нота) И Velocity (Скорость нажатия клавиш), можно применить два вида модуляции: частотную и амплитудную. В первом случае будет периодически меняться высота воспроизводимого сэмпла относительно взятой на клавиатуре ноты, а во втором — его относительный уровень в течение времени звучания. Если же мы применяем амплитудную модуляцию к генератору низкой частоты, то можем управлять также изменениями амплитуды колебаний высоты в течение времени.
При формировании звука может использоваться от одного до тридцати двух и более лееров, т. е. каждый звук, извлекающийся из инструмента при нажатии клавиш на MIDI-клавиатуре, может состоять из тридцати двух сэмплов, причем у каждого леера может быть свое место в панораме, своя громкость и своя собственная область действия.
Есть два способа распределения лееров. Первый — присвоение лееру определенной области на клавиатуре, где он действует. Например, при нажатии клавиши С4 будут воспроизводиться лееры 2, 4 и 5. а при нажатии клавиши С2 — лееры 1. 4 и 5. Второй способ — присвоение каждому слою своей области Velocity (Скорость нажат*= у-.?.зу:-х). и при разной скорости нажатия клавиш будут воспроизводиться разные лееры. Если вы еле касаетесь клавиш, то будут воспроизводиться слои 1 и 4, если же играете максимально экспрессивно, то будут воспроизводиться слои 4 и 5. Естественно, первый и второй способы распределения можно совмешать между собой.
Некоторые сэмплеры позволяют составлять несколько сэмплов в так называемый мультисэмпл или Keymap — «образ, карта клавиатуры», которые воспроизводятся в одном леере. Каждый сэмпл в мультисэмплс может иметь свою собственную область действия.
Одним и тем же контроллером можно управлять модуляцией как всех, так и только некоторых лееров, причем можно задавать разные допуски модуляции таким образом, что одно и то же изменение значения будет вызывать разное воздействие.
Эквалайзер. Для управления тембром звука используются эквалайзеры — программно-аппаратные средства, способные понижать или повышать уровень разных частотных полос. При этом понижается или повышается относительный уровень разных гармоник сигнала, в результате чего мы в акустических системах слышим изменение тембра згзука.
Известно два основных типа эквалайзеров — графические и параметрические. Первые отличаются наличием фиксированного количества полос: их обычно бывает 15 (можно менять уровень каждой 2Д октавы звукового диапазона) или 30 (можно менять уровень каждой '/, октавы звукового диапазона). На любой из полос уровень сигнала может опускаться или подниматься на 10—15 дБ (см. рис. 3.7 — графический 10-полосный эквалайзер Winamp). Параметрические эквалайзеры, в отличие от графических, могут настраиваться на любую частотную полосу любой ширины и поднимать/опускать ее уровень.
Графические эквалайзеры обычно используются для точной корректировки обшего звучания композиции. Еще одна область их применения — подгонка частотной характеристики контрольных акустических систем под акустические условия конкретного помещения.
С помощью параметрических эквалайзеров можно очень точно воздействовать на звук. Предположим, записан малый барабан ударной установки. У этого барабана есть специальная пружина, с помощью которой звук делают более «хлестким». Но при неправильном расположении микрофона характерный хлопок пружины может «вылезать» на передний план и портить общее звучание. Хорошо, если все можно переписать. А если нет — тогда выручает эквалайзер. Звукорежиссер точно настраивается на частотную полосу. в которой лежит хлопок и «вырезает» ее (уменьшает уровень). Остается нормальный звук малого барабана.
Точно так же с помощью параметрического эквалайзера можно, например, убирать неприятные гортанные призвуки в голосе вокалиста, подчеркивать щелчок медиатора по струнам гитары или делать тарелки ударной установки более «рассыпчатыми» и звонкими. Еще одна часто решаемая задача — «разнесение» инструментов по присущим им частотным полосам. Например, может оказаться, что при записи электрогитара, играющая риффы (периодически повторяющиеся ритмические фигуры), в самом низком своем регистре перекрывает бас-гитару. В результате вместо четкой и хорошо слышимой басовой линии получается невразумительный гул. Звукорежиссер с помощью эквалайзера немного убирает низкие частоты на дорожке гитары, освобождая таким образом частотную полосу баса от посторонних звуков. После такой корректировки гитара звучит там, где ей положено — на средних частотах, а бас остается в низкочастотном диапазоне.
Единый (общий) стандарт MIDI (General MIDI)
Ввод стандарта MIDI позволял музыкантам создавать аранжировки, используя любые инструменты MIDI, имевшиеся в наличии. Но когда созданные файлы проигрывались на другом синтезаторе, не было никакой гарантии, что звучание будет тем же самым, потому что различные изготовители могли назначить инструментам различные номера программ, так что фортепьяно, записанное на одном синтезаторе, может прозвучать как труба на другом и пр.
В сентябре 1991 г. Ассоциация изготовителей MIDI (ММА) и Японский комитет стандартов MIDI (JMSC) положили начало новому этапу в технологии MIDI, приняв стандарт «Общая
Система MIDI, уровень 1» (General MIDI System Level 1 — GM или GM1). Спецификация разработана, чтобы обеспечить необходимый уровень совместимости функционирования инструментов MIDI.
Спецификация налагает ряд требований на совместимые зву- когенерируюшие устройства (клавиатура, звуковой модуль, звуковая плата, программные продукты), включая:
минимум 24 канала («голоса») должно быть доступно одновременно для звуков мелодии и ударных инструментов, или 16 каналов для мелодии плюс 8 для ударных;
поддерживаются все 16 каналов MIDI, каждый из которых способен воспроизвести различное число голосов (полифония) или различные инструменты (звук, аккорд, тембр);
минимум 16 различных тембров может выполняться одновременно, воспроизводя различные инструменты. Поддерживается как минимум 128 предварительно настроенных инструментов (номера MIDI-программ), соответствующих Инструментальной карте GM1 (GM1 Instrument Patch Map), и 47 звуков ударных, которые соответствуют Карте ударных GM1 (GM1 Percussion Key Map). Мелодический набор состоит из 16 групп инструментов по 8 в каждой группе (фортепиано, органы, струнные, духовые, гитары, и т. п.).
За всеми инструментами были закреплены конкретные номера, поэтому мелодия, записанная в GM, будет похоже звучать на разных GM-синтезаторах. GS (General Synthesizer) — стандартный набор тембров фирмы Roland, включает дополнительно к General MIDI новые наборы мелодических и ударных инструментов, различные эффекты (скрип двери, звук мотора, крики и т. п.), а также дополнительные способы управления инструментами через MIDI-контроллеры. Многие звуковые карты поддерживают GM по умолчанию, a GS — в порядке расширения.
Стандарт X G (Extended General) фирмы Yamaha включает несколько сотен мелодических и ударных инструментов, применяемых профессиональными музыкантами. XG содержит значительно более развитые средства управления синтезом, чем GM и GS. Любой MlDI-канал может быть независимо от других установлен в режим мелодических или ударных инструментов. Использование стандарта XG позволяет создавать переносимые MIDI-файлы со звучанием, приближенным к профессиональному.