Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс Видео Весь-002.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
18.85 Mб
Скачать

6.2 Форматы звуковых файлов

Существуют 3 основных типа звуковых файлов:

1. Группа файлов, запись которых основана на технологии пульсовового кодирования (PCM, англ. Pulse Code Modulation). К этой группе относятся файлы форматов: WAV AIFF и внутренние форматы звуковых редакторов. Эти файлы качественно и точно передают звук, но имеют большой объём. По этой причине они неудобны для передачи по компьютерным сетям.

Microsoft RIFF/WAVE (англ. Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма) - стандартный формат звуковых файлов в компьютерах IBM PC. Файл этого формата содержит заголовок, описывающий общие параметры файла, и один или более фрагментов (англ. chunks), каждый из которых представляет собой волновую форму и вспомогательную информацию - режимы и порядок воспроизведения, пометки, названия и координаты участков волны. Файлы этого формата имеют расширение WAV.

Apple AIFF (англ. Audio Interchange File Format - формат файла обмена звуком) - стандартный тип звукового файла в системах Apple Macintosh. Похож на RIFF и также позволяет размещать вместе со звуковой волной дополнительную информацию.

2. Звуковые файлы, для уменьшения размера которых применено кодирование или сжатие. При разработке форматов таких файлов проводились психологические исследования для понимания специфики восприятия звука человеком. Например, звуковые волны не всех частот воспринимаются человеком даже в слышимом диапазоне. Есть возможность исключить их из записи. Эти исследования помогли разработать специальные алгоритмы сжатия (кодирования), в десятки раз уменьшающие объём звуковых файлов. При сжатии звука происходит в большей или меньшей степени потеря его качества.

Наиболее известные форматы сжатых звуковых файлов: MP3 (MPEG I, Layer 3), Vorbis, WMA (англ. Windows Media Audio), AAC (англ. Advanced Audio Coding).

Формат MP3 (более точно, MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — это лицензируемый формат файла для хранения аудио-информации. Количество каналов звука ограничено двумя.

На настоящий момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Файлы этого формата могут проигрываться практически в любой популярной операционной системе, на любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

В формате MP3 используется алгоритм сжатия с потерями качества звука, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения звукозаписи с качеством, близким к оригинальному. Принцип сжатия заключается в снижении точности воспроизведения некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия, он похож на используемый при записи графических файлов в формате JPEG. Наиболее распространённые кодеки формата МР3: mp3PRO-codec, LAME-codec.

Файл MP3 со средним битрейтом 128 кбит/с имеет размер примерно равный 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, что влияет на качество звука.

Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:

32—320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1 Layer 3;

16—160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3;

8—160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3.

Наиболее часто встречаются MP3 файлы с битрейтом 192 кбит/c, считается, что этот битрейт обеспечивает достаточное качество звука.

Vorbis - это сравнительно новый свободный распространяемый формат сжатия звука с потерями, являющийся бесплатной альтернативой MP3. Официально появился летом 2002 года. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение ogg и называется двойным именем «Ogg/Vorbis». Качество звука в этом формате при аналогичной степени сжатия выше, чем в MP3. Однако термином «Ogg Vorbis» называют и сам кодек без контейнера, так как он является частью проекта Ogg.

В 2007 году этот формат распространён существенно меньше, чем MP3. По всевозможным оценкам является вторым по популярности форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.

Vorbis идеален для применения в качестве звуковых дорожек фильмов, так как не изменяет их длину при переменном битрейте, что позволяет сохранять синхронность с видеодорожкой и применим для многоканального звука (например, 6-канальный звук DVD).

Windows Media Audio (WMA) — лицензируемый формат звукового файла, разработанный компанией Microsoft для хранения и трансляции аудио информации.

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматом Ogg Vorbis. В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества (англ. lossless), многоканальное кодирование объёмного звука и кодирование голоса.

AAC (англ. Advanced Audio Coding) — патентованный формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Данный формат, использующий сжатие звука с потерями, является одним из наиболее качественных и поддерживается большинством современного оборудования, в том числе портативного.

Превосходства AAC над MP3:

- до 48 звуковых каналов

- большая эффективность кодирования как при постоянном, так и при переменном битрейте;

- частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц — 48 кГц)

В 2008 году распространён значительно меньше, чем MP3 и другие альтернативные решения.

3. Формат MIDI. Аббревиатура MIDI означает (англ.) Musical Instruments Digital Interface, то есть цифровой интерфейс музыкальных инструментов. Этот довольно старый (1983 г.) формат больше напоминает программу, а не звуковой файл, он используется для управления синтезаторами звуковой карты. MIDI базируется на пакетах данных, каждый из которых соответствует некоторому событию, в частности, нажатию клавиши или установке режима звучания. Несмотря на свое изначальное предназначение, формат стал стандартным для музыкальных данных, которые при желании можно проигрывать с помощью звуковой карты компьютера безо всякого внешнего MIDI-оборудования.

Главным преимуществом файлов MIDI является их очень небольшой размер, поскольку это не детальная запись звука, а фактически некоторый расширенный электронный эквивалент традиционной нотной записи. Но это же свойство одновременно является и недостатком: поскольку звук не детализирован, то разное оборудование будет воспроизводить его по-разному, что может привести к заметному искажению замысла автора музыкального произведения.

6.3 Запись и обработка звука. Использование готовых звуковых файлов.

Качественная запись звука – это, прежде всего, ясность, четкость и естественная тональность звучания, которые достигаются путем грамотного размещения микрофонов. Современные микрофоны обладают одним приемным каналом и непригодны к избирательной передаче звуков, а человек слышит ушами и способен воспринимать звуки избирательно. Поэтому микрофон нужно ставить в такое положение, чтобы он передавал на записывающую аппаратуру только необходимые звуки. Посторонние шумы, не связанные с содержанием кадра, источник которых находится за его пределами, способны дезориентировать зрителей.

Оптимально записывать звук в предназначенной для этого студии звукозаписи с использованием профессионального оборудования и доверить это дело специалистам. Но такая возможность есть далеко не всегда, и профессиональная запись звука в настоящем пособии не рассматривается.

Для большинства малобюджетных учебно-методических или информационных фильмов голос диктора или несложные шумовые звуки можно записать самостоятельно с неплохим качеством. Для этого необходимо:

- работать в достаточно звукоизолированном помещении, где нет посторонних шумов;

- хороший микрофон, подключенный к персональному компьютеру (по умолчанию предполагается запись звука в цифровом формате);

- персональный компьютер;

- специализированная программа для записи и редактирования звука, например Adobe Audition, Sound Forge, WaveLab. Такие программы дают возможность просматривать осциллограммы обоих стереоканалов, прослушивать выбранные участки, делать вырезки и вставки, амплитудные и частотные преобразования, звуковые эффекты (эхо, реверберацию).

Основные правила и особенности, которые необходимо применяять и учитывать при самостоятельной звукозаписи.

1. Если микрофон будет стоять слишком близко к источнику звука, запись окажется лишенной глубины, будет восприниматься как зажатая и грубая.

2. Если же микрофон поставить на большом расстоянии от источника звука, запись получится глухой или с выделением отдельных случайных частот, что нежелательно (рис. 6.2).

3. Если надо записать речь одного человека в студии или в комнате, микрофон устанавливают на уровне губ говорящего и, как правило, не ближе 50 см.

В процессе речи голос человека меняет свою высоту, он может звучать громче или тише, кроме того, голос каждого человека отличается присущим только ему тембром.

Нижняя граница частотного диапазон голоса человека лежит в пределах 85-100 Гц, верхняя доходит до 3500-4500 Гц. Художественная речь по частотному диапазону значительно шире.

Однако, чтобы передать характерные особенности тембра, необходимо записывать и воспроизводить значительно более широкий частотный диапазон не менее 80-8000 Гц. В этом диапазоне сохраняются хорошая разборчивость и естественность звучания голоса.

Диапазон изменения громкости речи при художественном чтении составляет 40-50 дБ. Динамический диапазон речи диктора значительно уже (15-20 дБ).

Рис. 6.2 Размещение микрофона при записи дикторского комментария

4. Следует учитывать отличительные черты человеческой речи.

Разборчивость, внятность речи зависит не только от технических условий записи, но и от дикции исполнителя. Говорящий в микрофон не должен форсировать голос. Громкость речи должна соответствовать тому эффекту, который желательно получить по смыслу записи. Во всех случаях надо избегать чрезмерного снижения громкости, так как при этом изменяется тембр голоса, и при воспроизведении он будет казаться неестественно низким и густым. Кроме того, при малой громкости голоса в фонограмме могут прослушиваться посторонние шумы.