
УПИС лекции / 12. Звук
.docЗвук.
Звуковые файлы можно разделить на 2 типа: с оцифрованным звуком и с нотной записью.
Файлы с оцифрованным звуком содержат значения амплитуды звукового сигнала, измеренные через одинаковые промежутки времени. Процесс замены непрерывного сигнала последовательностью его значений называется дискретизацией (sampling). Каждое измеренное значение преобразуется в целое число длиной 8 или 16 битов со знаком или без, так осуществляется квантование (quantizing). Запись может осуществляться в режимах моно и стерео.
Процесс оцифровки звука именуется импульсно-кодовой модуляцией (ИКМ). Для осуществления ИКМ необходимо произвести 3 операции: дискретизацию сигналов во времени, квантование полученных импульсов по амплитуде, кодирование квантованных по амплитуде импульсов (преобразование квантованного импульса в число).
Файлы с оцифрованным звуком бывают двух видов: с заголовком (header) и без заголовка (headerless). В заголовке указываются параметры, которые характеризуют оцифрованный звук: частота дискретизации, количество битов на отсчет: 8 или 16, количество каналов – моно (1) или стерео (2), а также некоторые другие данные: ASCII-символы, описывающие тип файла, длина записанных данных в байтах, номер версии формата, метод компрессии, смещение блока данных относительно начала файла. Заголовки могут содержать и иную информацию.
Ниже приведены некоторые форматы с заголовком.
AIF или AIFF – Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.
AIFС или AIFF-С – AIFF с заданными параметрами сжатия (компрессии).
В формате AU структура файла намного проще, чем в WAV, но там указан метод кодирования данных. Файлы занимают очень мало места, за счет чего получили довольно широкое распространение в Интернете. Чаще всего можно встретить параметры: 8 кГц, моно. Но есть и 16-битные стерео файлы с частотами 22050 и 44100 Гц. Этот звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBSD.
VOC – восьмибитный моно формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).
НСОМ – то же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.
IFF – Interchange File Format. Эта технология хранения данных проистекает от Amiga-систем. Amiga – одна из первых систем, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, один раз звучит начало, затем повторяется второй фрагмент столько раз, сколько нужно, нота может звучать бесконечно долго.
WAV – самое простое хранилище дискретных данных. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в WAV может быть указано еще множество параметров, это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, также есть место для размещения текстовой информации.
Далее рассматриваются некоторые форматы без заголовка.
РСМ – pulse code modulation, что означает «импульсно-кодовая модуляция». Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающим форматом для всех звуковых файлов. Это не очень экономный метод для хранения данных.
Формат SND бывает двух видов. Один – это AU для SUN и NeXT. Другой – это 8-битный моно файл для РС и Macintosh с различной частотой дискретизации.
UL – Стандартный формат: 8 кГц, 8 бит, моно.
Файлы с нотной записью (song file, music file) содержат последовательность команд, сообщающих какую ноту, каким инструментом и как долго нужно воспроизводить в тот или иной момент времени. Формат может предусматривать одновременную игру нескольких музыкальных инструментов, в этом случае говорят о соответствующем количестве голосов (voices, каналов, channels, tracks). Например, плата Sound Blaster 16 поддерживает 20-голосный синтез.
При воспроизведении файлов с нотной записью могут использоваться следующие виды синтеза.
-
FM-синтез – частотная модуляция, т.е. имитация исполнения реальным музыкальным инструментом (пианино, гитарой и т. п.) ноты путем формирования огибающей синусоиды с частотой этой ноты.
-
Wavetable-синтез (табличный синтез) – использование оцифровок реальных инструментов, которые находятся в памяти самой звуковой платы.
-
Получение требуемой ноты из оцифровки одной ноты реального инструмента. Исходные оцифровки содержатся в файле с нотной записью или в отдельном файле (такие файлы одновременно являются файлами с нотной записью и содержат оцифрованный звук).
Ниже представлены некоторые форматы с нотной записью.
MID – формат файла, хранящего в себе сообщения для MIDI-системы, установленной на компьютере или на другом устройстве.
Файл в формате MOD хранит в себе короткий образец звука, который можно использовать в качестве шаблона для инструмента. Иначе говоря, это – помещённый в синтезатор сэмпл.