Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОТВЕТЫ К ГОСАМ.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
3.02 Mб
Скачать

4. Звук. Физические основы кодирования звука. Аналого-цифровой преобразователь и импульсно-кодовая модуляция. Параметры звуковых файлов - частота сэмплирования, глубина модуляции, битрейт.

Звук— упругие волны, распространяющиеся в среде и создающие в ней механические колебания.

В основе цифрового кодирования звука лежит процесс преобразования колебаний воздуха в колебания электрического тока (с пом. микрофона) и последующая дискретизация аналогового электрического сигнала.

Аналого-цифровой преобразователь— устройство, преобразующее входной аналоговый сигнал в дискретный код (цифровой сигнал).

Импульсно-кодовая модуляция (процесс, осуществляемый в АЦП): Для преобразования любого аналогового сигнала в цифровую форму необходимо выполнить две операции: дискретизацию и квантование.

Дискретизация состоит в представлении непрерывного во времени аналогового сигнала в виде дискретной последовательности его значений в выбранные моменты. Частота сэмплирования (частота дискретизации) — количество измерений амплитуды аналогового сигнала в секунду. Семпл — это промежуток времени между двумя измерениями амплитуды аналогового сигнал.

Чтобы однозначно восстановить исходный сигнал, частота дискретизации должна более чем в два раза превышать наибольшую частоту в спектре сигнала - 44100 kHz. (человек воспринимает волны в диапазоне 20Гц-20кГц, чтобы описать нужно измерить хотя бы 2 раза за такт).

Квантование представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования. Квантование - это нечто похожее на дискретизацию, только данная процедура производится не со временем, а со значением сигнала.

Глубина кодирования звука (глубина модуляции) — число бит, используемое для записи единичного звука.

Битрейт — количество звуковой информации в единицу времени (произведение частоты на глубину). Бит\сек. Битрейт – скорость потока данных, который и определяет, сколько бит нужно для кодирования одной секунды аудиоданных.

В форматах потокового видео и аудио, использующих сжатие с потерей качества, параметр «битрейт» выражает степень сжатия потока и, тем самым, определяет размер канала, для которого сжат поток данных.

5. Несжатые звуковые файлы в формате raw (pcm) и в форматах wav и Apple aiff. Контейнер riff и структура файла wav.

RAW — формат данных, содержащий необработанные данные. В таких файлах содержится полная информация о хранимом сигнале. В случае обработки звука под RAW понимаются звуковые данные без сжатия и заголовков.

PCM расшифровывается как импульсно-кодовая модуляция (pulse code modulation) и обеспечивает цифровое представление аналогового сигнала, который дискретизируется (оцифровывается) через равные промежутки времени (с заданной в герцах частотой) и представляется в двоичном виде (с заданной точностью - разрядностью в битах). Помимо использования PCM для цифрового звука в компьютере и на аудио компакт-дисках, данный формат применяется также в некоторых цифровых телефонных системах и в ряде форматов цифрового видео.

В формате PCM значения амплитуды звука представлены с помощью разного числа битов (разрядности); звуковая дорожка, как правило, оцифровывается с разрядностью от 12 до 24 бит, но чаще всего при студийном кодировании PCM-аудио для записи на диски Blu-ray используются 16 бит.

WAV (WAVE) — формат файла-контейнера для хранения записи оцифрованного аудио-потока. Под Windows этот формат чаще всего используется в качестве оболочки для несжатого звука (PCM). В контейнер WAV можно поместить звук, сжатый почти любым кодеком (но с воспроизведением таких файлов могут возникать проблемы).

Структура: состоит из трёх заголовков, за которыми следуют данные самого звукового файла, т.е. последовательность байт самого звукового сигнала.

Первый — RIFF заголовок. Он занимает 8 байт с самого начала файла и содержит информацию о длине файла

Второй заголовок — WAV заголовок, содержит информацию о кол-ве каналов (моно или стерео)

Третий заголовок – информацию о кол-ве байт, отводящихся под сами WAV данные

Далее идут сами данные звукового файла

Apple AIFF. Это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата.

Звуковые данные в стандартном файле формата AIFF представляют собой несжатую импульсно-кодовую модуляцию. Также существует и сжатая версия формата AIFF, которую называют AIFC (изредка AIFF-C), в которой для сжатия могут быть использованы различные кодеки.

AIFF, наряду с SDII и WAV, является одним из форматов используемых в профессиональных аудио и видео приложениях, так как в отличие от более популярного формата mp3 в нём звук не имеет потерь в качестве.

RIFF — один из форматов файлов-контейнеров для хранения потоковых мультимедиа-данных (видео, аудио, возможно текст). Наиболее известными форматами, использующими RIFF в качестве контейнера, являются: AVI (видео), WAV (аудио), RMI (MIDI-треки).

RIFF имеет ограничение размера данных в 2 ГБ.

Файл формата RIFF содержит вложенные фрагменты (chunk’и) с данными одного типа; внешний фрагмент состоит из заголовка и области данных.

Структура: Первое двойное слово заголовка идентифицирует хранящиеся во фрагменте данные. Второе двойное слово заголовка представляет собой размер области данных в байтах (без учета размера самого заголовка).

Область данных имеет переменную длину, однако она должна быть выравнена на границу слова (при необходимости дополняется в конце нулевым байтом до целого числа слов).