Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен2.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
3.69 Mб
Скачать

Вопрос 23. Изменение высоты/скорости звучания фонограмм, изменение частоты дискретизации

Изменение частоты дискретизации. Конвертеры частоты дискретизации (SRC) повсеместно используются в работе с цифровым звуком даже тогда, когда пользователь об этом не подозревает. Практически любой АЦП и ЦАП работают с так называемой передискретизацией, то есть осуществляют собственно АЦ- и ЦА-преобразование с повышенной частотой дискретизации (до мегагерцовых значений) и пониженной разрядностью (чаще всего 1 бит). Такаяпередискретизация производится цифровыми методами в цифровом сигнальном процессоре (DSP) конвертера.Программное изменение частоты дискретизации применяется как независимо для пользователя — внутри семплера или при микшировании звуковых потоков с разной частотой дискретизации в операционной системе, — так и по желанию пользователя, например, при преобразовании проекта из формата 96 кГц в 44,1 кГц в процессе мастерингаAudio-CD.

Существует популярное представление, что цифровой звук — это «ступеньки», аппроксимирующие звуковую волну, и когда ЦАП воспроизводит волну, аналоговый сигнал получается ступенчатым. На самом же деле правильнее представлять цифровую волну как мгновенные значения аналоговой волны в дискретные моменты времени. А ЦАП, чтобы восстановить аналоговую волну, осуществляет гладкую интерполяцию между цифровыми отсчетами. Вид этой интерполяции определяется фильтром передискретизации и, как правило, является приближением к частотно-ограниченной интерполяции с помощью sinc-функций. Это позволяет избежать искажений при работе с высокочастотными сигналами. На риспоказан пример восстановления тона с частотой 13 кГц при частоте дискретизации 44,1 кГц. При «ступенчатой» интерпретации волна даже отдаленно не напоминает синусоиду, а корректная передискретизация восстанавливает тон практически идеально. Кстати, этот пример показывает еще один интересный факт: аналоговая волна может иметь более высокие пиковые значения, чем цифровые отсчеты, и это может перегружать ЦАП при воспроизведении.

Наиболее просты алгоритмы изменения частоты дискретизации в целое число раз. При уменьшении частоты дискретизации в N раз частота Найквиста (половина частоты дискретизации) становится в N раз ниже, т.е. частотный диапазон сужается. Поэтому для предотвращения наложения спектра (алиасинга) применяют НЧ-фильтр, подавляющий все частотные составляющие выше будущей частоты Найквиста. После фильтрации отсчеты сигнала прореживаются в N раз. При этой операции спектр сигнала ниже новой частоты Найквиста остается неискаженным.

Для увеличения частоты дискретизации в M раз сигнал сначала интерполируется («разбавляется») нулями. Это сохраняет неизменным спектр сигнала ниже частоты Найквиста, но создает копии спектра выше частоты Найквиста. После этого возникшие копии спектра отфильтровываются НЧ-фильтром.

Понятно, что параметры алгоритма определяются свойствами НЧ-фильтра. Гладкость АЧХ и ФЧХ фильтра в полосе пропускания обеспечивает неискаженную передачу сигнала в допустимом частотном диапазоне.

Для передискретизации сигнала в нецелое число раз (например, из 96 кГц в 44,1 кГц) можно скомбинировать повышение и понижение частоты дискретизации в целое число раз (например, 44100 = =96000×M/N = 96000×147/320). Поскольку НЧ-фильтрация выполняется после повышения частоты дискретизации в M раз, но до понижения ее в N раз, то две фильтрации можно совместить в одну, установив частоту среза фильтра на минимум из двух необходимых частот среза. Отметим, что фильтр в данном случае работает над сигналом с повышенной в M раз частотой дискретизации.

Специальные алгоритмы полифазной фильтрации позволяют избежать явного вычисления такого промежуточного сигнала, сокращая число операций. Они сразу вычисляют отсчеты выходного сигнала как взвешенную сумму окружающих отсчетов входного сигнала и подмножества коэффициентов фильтра. При этом число операций почти не зависит от величин M и N, а зависит лишь от порядка интерполяции, то есть от числа взвешиваемых отсчетов входного сигнала.

Большинство конвертеров частоты дискретизации работают именно по принципу полифазной фильтрации, а в качестве фильтра используется НЧ-фильтр с линейной фазой.

Изменение высоты/скорости звучания фонограмм

Один очевидный и известный способ воздействия на высоту: если пластинкупроигрывать быстрее, то и высота сдвигается. Но при таком способеизменяется не только высота, но и темп.

Самое интересное начинается тогда, когда мы хотим независимо друг от друга сдвигать высоту и менять темп.

Задача сдвига высоты достаточно интересна. Онане формализуется, потому что требуется менять не физические параметры, а психоакустические. То есть ее надо решать так, чтобы человеку казалось, что темп остается, а высота меняется, и при этом все свойства звука остаются.

Самыми известными на сегодня способами изменения звуковысотности с сохранением темпа являются кратномасштабный, разделение на частоты и гранулярный синтез.

Гранулярный подход состоит в том, чтобы разбить отрезок звуковой волны на короткие фрагменты (гранулы) от 10 до 100 миллисекунд и, в зависимости от поставленной задачи, изменить их количество, размер, способ наложения друг на друга и воспроизвести в желаемой последовательности. Для того чтобы избежать щелчков, "стыки"между гранулами сглаживаются, а хорошим показателем этого процесса является неискаженная амплитуда.

То же самое происходит когда нам нужно изменить скорость фонограммы, без изменения высоты, но в этом случае гранулы не растягиваются или сжимаются (изменяется высота), а просто либо убирают каждую вторую (если нужно замедлить в 2 раза), либо каждую дублируют (если нужно ускорить в 2 раза). Стыки сглаживаются кросфейдером чтобы предотвратить щелчки, размеры гранул могут быть одинакового размера(в дешевых устройствах), либо разного в зависимости от формы волны( дорогие устройства).

Способ разделения на частоты:Известно, что человеческий слух реагирует на звуковые колебания логарифмически: разница воспринимаемой человеком высоты между звуками с частотами 100 и 120 Гц примерно такая же, как и между 1000 и 1200 Гц. Существует разбиение всех частот на диапазоны, которое принято называть пирамидальным. Оно очень хорошо сочетается с устройством человеческого слуха: диапазоны частот получаются одинаковой логарифмической ширины, а значит, одинаково значимы для человеческого уха. Такой подход удобен, поскольку размеры гранул нужно определить только для одной полосы, а переход на другую полосу – это просто масштабирование. Для этого необходимо настроить размер наименьшей гранулы Δ (для высокой полосы частот) и самой большой (для низкой полосы). В этом состоит суть кратномасштабного подхода.