Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Rita_2.docx
Скачиваний:
28
Добавлен:
17.04.2019
Размер:
310.83 Кб
Скачать

Сжатие с потерями

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы:

  • частотное (одновременное) маскирование

  • временное (неодновременное) маскирование

Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного.

Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости (порог слышимости одного сигнала в присутствии другого), когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки (изменение порога слышимости после сигнала высокого уровня) и предмаскировки (изменение порога слышимости перед приходом сигнала максимального уровня). Более слабый сигнал становится неслышимым за 5 − 20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения.

Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров который разделяет сигнал на частотные поддиапазоны. На выходе каждого фильтра оказывается та часть входного сигнала, кото­рая попадает в полосу пропускания данного фильтра. Далее, в каждой полосе с помощью психоакустической модели, анализируется спектральный состав сигнала и оценивается, ка­кую часть сигнала следует передавать без сокращений, а какая лежит ниже по­рога маскирования и может быть переквантована на меньшее число бит. Для сокращения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами.

Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве.

49.Параллельная и последовательная запись, обработка и передача цифровых потоков.

Суть метода многоканальной последовательной записи заключается в том, что ансамбль записывается частями (например, сначала только аккомпанемент, а затем солист). Делается это так: после записи аккомпанемента его воспроизводят, подавая сигнал на головные телефоны. В студии у микрофона располагается солист, который исполняет свою партию под аккомпанемент, прослушиваемый им через наушники. Запись солиста ведется на отдельный канал. Потом каналы с записями аккомпанемента и солиста микшируются (совмещаются при помощи микшера), звукорежиссер подбирает и регулирует соотношения уровней между каналами. Суммарный сигнал представляет собой законченную фонограмму полного произведения.

Запись аккомпанемента, в свою очередь, может быть сделана таким же методом: на отдельный канал записывается каждая группа исполнителей или даже каждый инструмент из ансамбля.

При многоканальной параллельной записи все группы исполнителей записываются одновременно, каждая на свой канал. Исполнители и микрофоны должны быть расположены так, чтобы микрофон каждого канала воспринимал звуки в основном только от своей группы исполнителей. Когда запись закончена, включается воспроизведение и выполняется микширование (сведение) сигналов всех каналов в один канал (для монофонической записи) или два канала (для стереофонической записи). Такой способ применяется в основном при записи больших музыкальных коллективов.

Чтобы звучание всех партий, записанных в разное время на разных каналах, совпало и при этом точно соблюдался ритмический рисунок произведения, всем исполнителям на головные телефоны для синхронизации подается записанный ранее сигнал ритмической партии. Для следующей группы исполнителей будут воспроизводиться уже записанные партии и т. д. Распределение исполнителей по группам зависит прежде всего от характера и инструментовки произведения, а также от акустических характеристик студии. Поэтому для каждого конкретного случая звукорежиссер подбирает свои условия записи. Дальнейшее сведение и монтаж производятся так же, как и при методе параллельной записи.

Для подобного рода записи на компьютере должна быть установлена такая звуковая карта, которая позволяла бы одновременно осуществлять запись и воспроизведение (обеспечивала бы полный дуплексный режим) для того, чтобы непосредственно при записи следующего канала можно было воспроизводить ранее записанные каналы.

Обрабатывается сигнал с помощью установленной на компьютере специальной программы, позволяющей работать со звуком. Большим удобством при монтаже является визуальное представление сигнала на экране монитора, когда звук изображается в виде волновой формы (сигналограммы). С помощью такого представления сигнала можно легко и быстро находить монтажную точку в четкой ритмичной музыке и в речи, где хорошо заметны паузы. Здесь также помогает функция лупы, с помощью которой можно увеличивать временной масштаб в миллисекундной области. В файле точное местоположение щелчков и выпадений звука даже легче находить на экране монитора, нежели на слух. Для устранения щелчка сначала обозначают его начало с помощью мыши, а затем вырезают при помощи соответствующей функции. Провалы сглаживаются посредством интерполяции (реконструкция сигнала).

Современные программы цифровой обработки звука, как правило, обеспечивают неразрушающую технологию редактирования. Это значит, что в процессе обработки звукового файла изменяется не открытый файл, а его копии (копии его частей), которые хранятся в оперативной памяти компьютера или на диске в виде временных файлов. Физически исходный материал не изменяется до тех пор, пока не будет выполнена команда сохранения. Обработанный файл, безусловно, можно сохранить и под другим именем, оставив для себя как исходный, так и конечный вариант.

Нелинейная система позволяет производить такие эффекты обработки, которые невозможны на линейных носителях. Прежде всего, это эффекты, связанные с изменением временных параметров записи: сжатие, растяжение во времени (как с изменением тональности, так и без него). В ряде случаев бывает необходим и противоположный эффект – изменение тональности без изменения темпа.

Скорость передачи цифровых данных. При цифровой записи звука всегда производится помехоустойчивое кодирование, при котором вводятся проверочные данные. По этому скорость цифрового потока передачи данных возрастает на 25.....50 %. Одновременно с музыкальной программой всегда записывается и дополнительная информация для потребителя (номер и название альбома, номер фрагмента, название музыкального произведения, фамилии композитора и исполнителей, текущее время и др.). Это тоже увеличивает скорость цифрового потока на 5...10%. В результате общий коэффициент избыточности кода R может быть от 1,4 до 1,6. Во столько же раз возрастает и скорость передачи цифрового потока данных ( =R ).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]