Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по мультимедиа.doc
Скачиваний:
30
Добавлен:
08.05.2019
Размер:
757.25 Кб
Скачать

Глава 3. Стандарты и структура мультимедийных файлов Звуковые файлы

Существует три основных формата звуковых файлов:

  • Waveform audio - WAV или WAVE (wave-файлы, имеют расширение wav)

  • Musical Instrument Digital Inrerface - MIDI или MID (midi-файлы, имеют расширение mid)

  • MPEG - на компьютере пользователя имеют расширение .mp3

WAV-файлы - это полный аналог записи на магнитофонную ленту, только значения амплитуды сигнала записывается не в аналоговом виде, а в виде последовательности цифровых кодов, соответствующих значению амплитуды звукового согнала в каждый момент времени сигнала

Для записи WAV-файла необходима специальная аппаратура, как правило это дополнительная звуковая плата компьютера, включающая - аналого - цифровой преобразователь, который в последовательные моменты времени замеряет амплитуды сигнала и записывает их в память компьютера в виде 8-ми или 16-ти разрядных кодов, и для воспроизведения цифро- аналоговый преобразователь, который по записанным кодам, восстанавливает амплитуду согнала, т.е. приводит его к исходному виду. Поскольку звуковой сигнал записывается в памяти компьютера в виде цифр, его можно корректировать - изменять амплитуду, а значит громкость, отсеивать шумы, изменять тембр и т. д.

Файлы с расширением .WAV, к сожалению, довольно громоздки - занимают сотни Кбайт на каждую минуту записи. Так например, знакомый всем звук аккорда, который проигрывается при завершении загрузки ОС WINDOWS 95 и звучит 6,12 секунды, занимает 135 876 байт.

Информация при записи WAVE-файлов сжимается как аппаратными входящими в состав звуковой платы, так и программными, входящими в состав операционной системы, средствами для уменьшения размеров файла.

Размер файлов зависит прежде всего от частоты квантования, задающей число выборок (отсчетов) звукового сигнала в единицу времени. Именно эти выборки представляются АЦП в виде двоичных чисел, несущих информацию о мгновенном значении сигнала в моменты выборок. Звуковые компакт-диски, к примеру, имеют частоту квантования 44.1 кГц. Считается (приближенно), что частота квантования должна быть вдвое выше высшей частоты спектра звуковых сигналов. Практически частота квантования в 44.1 кГц позволяет записывать (и затем воспроизводить) весь частотный диапазон звуковых сигналов - от 20 до 20 000 Гц.

Однако для записей умеренного качества достаточен более узкий диапазон частот - например для разборчивой речи от примерно 400 до 3 500 Гц. Поэтому при записи WAVE-файлов предусматривается ряд частот квантования, чаще всего от 5 Кгц до 44-45 Кгц., а точность измерения уровня сигнала может быть выбрана 8 или 16 разрядов. Чем ниже частоты квантования, чем меньше точность измерения тем меньше (пропорционально) размер WAVE-файлов и хуже качество воспроизведения звука.. Переход от двухканальной (стереофонической) записи с одноканальной (монофонической) уменьшает длину звуковых файлов вдвое. Проигрыватели WAVE-файлов обычно автоматически распознают тип записи и частоту квантования.

WAV-файлы обычно используются для записи и воспроизведения речи или голоса певца, так как они имеют индивидуальную окраску и искусственно создать голос с характеристиками голоса Шаляпина невозможно, а вернее очень трудно. Хотя в прессе появляются сообщения, что разработаны программы, которые могут говорить голосом любого человека. Они сначала анализируют записанные тексты, выявляют индивидуальные особенности индивидуума, а затем могут синтезировать произвольную речь или даже песню голосом этого человека.

MIDI-файлы не являются непосредственной записью звуков, а представляют собой набор команд, какой музыкальный инструмент, какую ноту, какой длительности (и некоторые другие характеристики) использовать Реальной звуковой информации такие файлы не несут. Они просто указывают, когда и в какой момент должен звучать тот или иной музыкальный инструмент, по какому каналу, с какой громкостью и какими иными звуковыми параметрами. Словом, MIDI-файлы являются набором инструкций для синтезатора музыкальных звуков. Можно сказать, что они подобны нотам, по которым исполняется музыкальное произведение - не случайно есть программы, которые по таким файлам действительно воссоздают нотные записи музыки!

Однако как и сами ноты это не музыка и для получения ее нужен исполнитель и музыкальный инструмент, так и MIDI-файлы требуют для получения музыки своего инструмента - синтезатора музыки - в постом случае это звуковая плата компьютера. Принцип синтеза здесь следующий - в памяти звуковой платы записываются образцы звучания всех нот нескольких инструментов, от трех до двадцати инструментов. В соответствии с командами из файла, извлекается тот или иной эталон, возможно модифицируется - изменяется тембр, громкость, высота и преобразуется в аналоговый сигнал и подается на выходной усилитель.

Эти файлы используются для записи и воспроизведения инструментальной музыки и генерации музыкального сопровождения и аранжировки музыкальных произведений.

Такой подход приводит к тому, что MIDI-файлы имеют значительно меньший размер, чем файлы с информацией о реальных звуках. С частотным диапазоном и частотами квантования размеры MIDI-файлов никоим образом не связаны. В результате запись даже довольно длинного музыкального произведения занимает обычно десятки Кбайт (редко до 150-200 Кбайт). Если преобразовать MIDI- файл размером в 20 кб. В WAV-файл, то последний будет около 3 мб. MIDI-файлы поддерживают работу как обычных музыкальных синтезаторов, использующих частотную модуляцию FM (Frequense Modulation), так и более новых волновых синтезаторов WS.

Файлы MPEG

Существует четыре версии алгоритма сжатия файлов MPEG, которые обозначаются как MPEG-1 - MPEG-4. В Internet наиболее часто используется версия MPEG-1, хотя по мере развития коммуникационных технологий будут внедряться и остальные варианты. Стандарт MPEG-1 определяет три уровня, каждому из которых соответствует свой собственный формат. Усложненные алгоритмы более высокого уровня требуют более длительного времени работы, однако обеспечивают более высокие степени сжатия при сохранении практически точного соответствия оригиналу. Уровень I обеспечивает самую высокую скорость кодирования, а уровень III дает наибольшую степень сжатия при сопоставимом качестве звука. Для звуковых файлов наиболее часто используется MPEG-1 уровня III (расширения файлов .МР3) Все уровни основаны на психоакустических моделях, которые обосновывают выбор частотных составляющих сигнала, которые могут быть отброшены без ущерба для субъективного восприятия качества звучания. Файлы MPEG-1 уровня III сохраняют практически неотличимое от несжатого оригинала качество звучания при степени сжатия до 12:1.

Эта система кодирования звуковых файлов , чрезвычайно широко распространенной в Internet. Существуют специальные музыкальные сервера или отдельные музыкальные страницы на которых имеются ссылки на музыкальные произведения. Например в России есть сервер www.music.ru с обширным музыкальным архивом CD-ROMов различных российских и зарубежных групп. Пользователь может зайти на этот сервер, выбрать любимую музыкальную группу, диск, произведение и щелкнуть мышью на значок рядом с названием, после этого на компьютер пользователя будет загружаться по частям звуковой файл в специальном формате и воспроизводиться с хорошим или не очень хорошим качеством, - в зависимости от скорости работы линии связи, которая используется для соединения с Internet.

Предварительно пользователь должен загрузить и установить у себя на компьютере специальную программу - Real Radio плейер или другую. Ее можно взять бесплатно на сервере www.mpeg3.org. Там есть две версии этой программы - бесплатная и за 30$. Платная версия обладает более широкими возможностями. Программа скачивается в виде exe-файла, после его переписи на компьютер пользователя это файл надо запустить на выполнение и плеер будет установлен.

Преимущества данной технологии в том, что информация передается клиенту непосредственно с транслирующего сервера без предварительной загрузки и сохранения на жестком диске компьютера. Однако, качество воспроизведения сильно зависит от скорости канала и качества связи по нему. На линии 14.4 кб/сек - нормальное воспроизведение монофонной программы, на 28.8 кб/сек - стереопрограммы с качеством близким к УКВ приему, на ISDN линиях качество близко к компакт-диску.

Управление плеером достаточно простое, позволяющее останавливать проигрывание, возобновлять с точки прерывания или с любого места. Разумеется эти действия можно выполнять, если поток транслируется не в прямом эфире.