Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Sbornik_statey_po_teorii_zvuka.pdf
Скачиваний:
198
Добавлен:
22.05.2015
Размер:
4.96 Mб
Скачать

Краткая теория звука.

Что такое звук?

Любой человек, который учился (или учится) в школе, без особых размышлений ответит на этот вопрос так: «Звук - это волна». И будет совершенно прав. А вот при попытке объяснить, что же представляет собой эта волна, большинство людей вспоминает хрестоматийный пример с веревкой или волнами на поверхности воды и после этого надолго задумываются. Так что же такое звук?

Любой предмет, совершающий возвратно-поступательные движения (камертон, струна рояля или гитары, наши голосовые связки и т.д.), вызывает в воздухе попеременное уменьшение или увеличение плотности. Движения одних молекул воздуха передаются другим молекулам, в результате чего в пространстве распространяются периодически повторяющиеся зоны увеличения и уменьшения плотности. Они-то и представляют собой звуковую волну(Рис. 1.). Если мы в каком-то месте поставим прибор, способный реагировать на изменение плотности воздуха, запишем его показания в течение некоторого времени и составим график зависимости плотности от времени, то получим кривую, близкую к синусоиде, знакомую нам по школьным учебникам физики (Рис. 2). Именно такие колебания и улавливаются нашим ухом, в результате чего мы получаем ощущение звука.

Рис.1

Рис 2

Частота, длина, амплитуда и фаза звуковой волны

Количество колебаний воздуха в секунду называется частотой звука. Волны с разной частотой воспринимаются нами как звук разной высоты: волны с малой частотой воспринимаются как низкие, басовые звуки, а волны с большой частотой - как высокие. Частота измеряется в Герцах (Гц): 1 Гц = 1 колебание в секунду; или килогерцах (кГц): 1кГц = 1000 Гц. Большинство людей от 18 до 25 лет реально способны слышать колебания воздуха с частотой от 20 до 20000 Герц (с возрастом верхняя граница восприятия уменьшается). Именно этот диапазон волн называется звуковым диапазоном. Кстати говоря, наши уши устроены таким образом, что когда мы слышим два звука, частоты которых относятся как 2:1, то нам кажется, что эти звуки близки друг к другу и при одновременном воспроизведении они для нас как бы сливаются. Именно на этом эффекте основана музыкальная шкала высоты звуков, у которой одна и та же нота повторяется каждую октаву. То есть в натуральном звукоряде частоты одинаковых нот соседних октав соотносятся между собой как 2:1.

Частота волны обратно пропорциональна длине волны - отрезку на оси распространения волны, в котором умещается полный цикл (период) изменения плотности воздуха. Чем больше частота звука, тем меньше длина волны и наоборот. Длину волны очень легко вычислить по формуле l=C/f, где C - скорость звука (340 м/с), а f - частота звуковых колебаний. Например, волна, имеющая частоту 100 Гц, имеет длину 340/100=3.4 м.

Амплитудой звуковой волны называется половина разницы между самым высоким и самым низким значением плотности. На графике амплитуде будет соответствовать разница между самой высокой (или низкой) точкой волны и горизонтальной осью графика.

Для описания относительных временных свойств двух звуковых волн (или разных частей одной волны) вводится понятие фазы звуковой волны. Посмотрите на рисунок. На первом графике показаны две волны, которые полностью совпадают друг с другом. В этом случае говорят, что волны находятся в фазе. На третьем графике в том месте, где у одной волны находится область высокой плотности, у другой - область низкой плотности. В этом случае говорят, что волны находятся в противофазе. При этом, если волны одинаковые, происходит их взаимное уничтожение (в природе это бывает крайне редко, чаще противофазные волны при наложении сильно искажают звук). Средний график показывает некое промежуточное положение. В этом случае говорят, что фаза одной волны сдвинута относительно другой.

Уровень и громкость звука

Любая звуковая волна, которая распространяется в пространстве, может оказывать на встречающиеся препятствия (в том числе и на наши барабанные перепонки) некое давление. Люди, которые бывали на рокконцертах и стояли около мощных колонок не понаслышке знают, что оно может быть и очень сильным. Мы субъективно воспринимаем изменение давления звуковых волн в виде ощущения изменения громкости звука. Максимальное изменение давления в воздухе при распространении звуковых волн по сравнению с давлением при отсутствии волн называется звуковым давлением. Как и любое другое, звуковое давление измеряется в Паскалях (Па).

Но в акустике, при оценке интенсивности звуковых волн чаще применяется другое понятие - сила звука. Оно показывает поток звуковой энергии, который каждую секунду проходит через квадратный сантиметр условной плоскости, расположенной перпендикулярно направлению распространения волны. Звуковое давление и сила звука находятся в квадратичной зависимости. То есть, сила звука = звуковое давление в квадрате. Сила звука описывает энергетические свойства самой волны и измеряется в ваттах/квадратный сантиметр (Вт/кв.см.). Такая единица бывает очень удобна при некоторых расчетах - это единственная причина ее введения.

Для того, чтобы мы смогли услышать тот или иной звук, его сила должна быть больше определенного уровня. Этот уровень называется порогом слышимости. То есть, если звуковая волна имеет малую интенсивность - ниже этого порога, мы просто не воспринимаем ее, и нам кажется, что вокруг стоит полная тишина, хотя на самом деле воздух вокруг колеблется. Точно также дело обстоит и со звуками большой интенсивности - мы слышим звук только до определенного уровня, который называется болевым порогом. Если сила звука больше этого уровня, то мы испытываем боль в ушах. Разница между уровнями болевого порога и порога слышимости называется динамическим диапазоном слуха. Мы способны воспринимать изменения силы звука в огромных пределах: сила звука болевого порога превосходит силу звука порога слышимости в тысячу раз!

Наш слуховой аппарат устроен таким образом, что линейное изменение силы звука (или звукового давления) не воспринимается нами как линейное изменение громкости. Громкость звука и его сила связаны между собой более хитрой зависимостью. Увеличение громкости в два раза соответствует увеличению силы звука в 100 раз (звукового давления - в 10 раз), увеличение громкости в 3 раза соответствует увеличению силы звука уже в 10000 раз (звукового давления - в 100 раз), а увеличение громкости в 4 раза соответствует изменению силы звука в 100000000 раз (звукового давления - в 10000 раз)! Такая зависимость называется логарифмической, и именно из-за такой особенности нашего восприятия изменение уровня (громкости) звука принято измерять в логарифмических единицах - белах (Б).

Различие величин силы звука в белах вычисляется по формуле: N=lg I1/I2 (на всякий случай, напомним, что lg - это десятичный логарифм, и он показывает степень, в которую возводится число 10; то есть, если 10lg=100, то lg=2, иначе lg100=2), где N - изменение уровня звука, а I1 и I2 - верхняя и нижняя границы силы звука.

Десятикратное увеличение силы звука соответствует 1 белу (lg10=1), а стократное увеличение соответствует двум белам (lg100=2) и т. д. Словом, логарифмическая шкала позволяет достаточно сильно «сжимать» линейную шкалу, сохраняя при этом достоверность. И именно такая шкала полностью соответствует особенностям нашего слуха.

Изменение уровня звука в один бел одинаково отражает и изменение силы звука, и изменение звукового давления. Если вы подставите в вышеприведенную формулу соответствующие значения звукового давления (памятуя, что сила звука = звуковое давление в квадрате), то получите те же самые значения изменения уровня в белах. Судите сами:

N= lg I1/I2=lg (P1/P2)2=2lg P1/P2, где P1 и P2 - верхняя и нижняя границы звукового давления.

Проверяем. Изменение звукового давления в 100 раз соответствует изменению силы звука в 10000 раз (I=P2). Подставляя эти значения в вышеприведенную формулу, мы получаем следующие вещи: lg 10000=4 бела (изменения силы звука); 2lg 100=2х2=4 бела (изменения звукового давления). Как видите, в обоих случаях мы получили одинаковые изменения уровня звука в белах.

Но на практике оказывается, что бел - это слишком большая величина для изменения уровня. Поэтому чаще применяется децибел (дБ) - десятая часть бела. То есть изменение уровня в децибелах будет вычисляться по формуле N=10 lg I1/I2 или N=20 lg P1/P2. Минимальный перепад уровня, который способно воспринять наше ухо, как раз равен одному децибелу. Это одна из главных причин введения такой системы измерения уровня. А весь динамический диапазон слуха составляет 120 дБ. Согласитесь, что гораздо удобней оперировать

единицами, которые мы можем услышать.

Изменение уровня звука обычно оценивается в децибелах относительно порога слышимости. Когда говорят, что уровень звука в колонках равен ста децибелам, подразумевают, что колонки работают на уровне, превышающем порог слышимости на 100 дБ.

Для того, чтобы как-то почувствовать такой непростой способ измерения уровня звука (лишь отражающий парадоксальность нашего слухового восприятия), мы приведем таблицу со знакомыми вам звуковыми объектами и уровнями звука, которые они производят. Просмотрев эту таблицу, вы сможете более наглядно представить себе логарифмическую шкалу уровня.

Слуховой порог

 

0

 

 

 

 

 

Шепот на расстоянии 1 м

 

20

 

 

 

 

 

Шум в квартире

 

40

 

 

 

 

 

Шепот на расстоянии 10 см

 

50

 

 

 

 

 

Тихий разговор на расстоянии 1 м

 

50

 

 

 

 

 

Аплодисменты

 

60

 

 

 

 

 

Игра на акустической гитаре пальцами; звук на расстоянии 40 см

 

70

 

 

 

 

 

Тихая игра на фортепиано

 

70

 

 

 

 

 

Игра на акустической гитаре медиатором; звук на расстоянии 40 см

 

80

 

 

 

 

 

Шум в метро во время движения

 

90

 

 

 

 

 

Громкий голос на расстоянии 15 см

 

100

 

 

 

 

 

Фортиссимо (максимально энергичный пассаж) оркестра

 

100

 

 

 

 

 

Реактивный самолет на расстоянии 5 м

 

120

 

 

 

 

 

Барабанный бой на расстоянии 3 см

 

140

 

 

 

Кстати говоря, последняя строчка таблицы показывает уровень звука, превышающий болевой порог. Поэтому никогда не пытайтесь послушать звук барабана прямо у мембраны - ощущения будут очень неприятные.

Теперь давайте более подробно поговорим о громкости звука - нашем субъективном ощущении от звуковых волн, имеющих разный уровень (звуковое давление, силу). Наше ощущение громкости во многом зависит от частоты звука. Высокие и низкие звуки, имеющие одинаковый уровень, субъективно воспринимаются нами как звуки разной громкости. А значение уровня звука и субъективно слышимой громкости совпадают только на частоте 1000 Гц. На основании исследований человеческого слуха были построены графики, которые известны каждому звукорежиссеру как кривые равной громкости. На них изображены линии (они расположены через 10 дБ на частоте 1000 Гц), которые соответствуют одинаково воспринимаемой громкости на разных частотах (см. рисунок). Легко можно видеть, что мы гораздо лучше слышим на средних частотах. А вот на

низких и высоких частотах чувствительность слуха притупляется.

Из графика кривых равной громкости следует важный для практической деятельности вывод. Посмотрите на рисунок - наиболее линейно мы воспринимаем звук при уровнях 80-90 дБ. То есть при таких уровнях громкости наши уши наиболее адекватно передают звуковую картину. Поэтому любые работы по корректировке звучания фонограмм лучше всего делать при достаточно высокой громкости звука в акустических системах - 80-90 дБ (примерно такой же уровень имеет шум в вагоне метро - см. таблицу). Если мы будем заниматься работой со звуком при меньших уровнях, то вероятность ошибки будет возрастать - ведь восприятие низких и высоких частот будет притупляться.

Тембр звука

Гитарист может извлекать из своего инструмента высокие и низкие, громкие и тихие звуки. Но что гитару делает гитарой? Почему ее звук отличается от звука фортепиано? Все объясняется довольно просто: реальные звуки представляют собой созвучия, состоящие из нескольких простых звуковых волн. От комбинаций этих волн и зависит тембр инструмента.

У каждого созвучия есть основной тон - волна определенной частоты, которая имеет наибольший уровень. Например, у ноты Ля первой октавы эта волна имеет частоту 440 Гц. Но вместе с ней звучат и другие волны, частота которых в 2, 4, 8 раз и т.д. выше, чем у основного тона (эти звуки располагаются через октаву). В музыке они называются обертонами. В акустике принята немного другая терминология. И основной тон, и обертона называются гармониками и имеют порядковый номер в зависимости от высоты: основной тон - первая гармоника, первый обертон - вторая гармоника и т.д.

Стоячие волны и резонанс

Звуковая волна, которая встречает на своем пути перпендикулярную твердую поверхность (например, стену), отражается от нее и возвращается по тому же самому пути. Две волны, движущиеся в противоположные стороны способны производить так называемые стоячие волны, которые окрашивают звук новыми гармониками(то есть изменяют тембр звука). Например, в замкнутом прямоугольном помещении стоячие звуковые волны находятся точно посередине комнаты. И если вы встанете в это место, то услышите, как

изменился звук (чаще всего в худшую сторону).

Если длина волны источника звука становится кратна длине помещения, то фаза отраженной волны совпадает с фазой прямой волны, в результате чего происходит их взаимное усиление. А так как в прямоугольном помещении звук отражается от стен несколько раз, то происходит многократное усиление громкости звука. То есть, возникает воздушный резонанс - частный случай стоячей волны.

Любое помещение имеет некую критическую частоту звука при которой возникает резонанс. Причем у помещений с разными геометрическими размерами будут разные критические частоты. Эту частоту называют частотой резонанса. Резонанс чаще всего возникает именно на низких частотах, так как длина волны низких звуков сравнима с длиной и шириной помещения. Кстати, бас-гитаристы, репетирующие дома, отлично знакомы с таким эффектом: некоторые взятые на инструменте ноты неожиданно усиливаются, при этом начинают угрожающе звенеть стекла в окнах и шкафах.

Резонанс, в большинстве случаев, явление крайне неприятное. Поэтому в музыкально используемых помещениях с ним борются всеми возможными способами. Например, ликвидируют параллельные поверхности - студийные комнаты очень часто проектируются таким образом, что все углы имеют величину больше 90 градусов. Однако резонанс не всегда бывает вреден. В духовых инструментах и органах это явление используют для усиления звука и получения характерного тембра.

У любой трубки есть своя частота резонанса, которая определяется геометрическими размерами самой трубки. Если в такую трубку попадает звуковая волна (например, от трости саксофона), то в центре сечения трубки возникает резонансная волна определенной частоты, которая усиливает звук и украшает его новыми гармониками. Меняя длину трубки, мы можем добиться изменения высоты звука. Именно такой принцип управления используется во всех духовых инструментах: например, в тромбоне музыкант выдвигает колено трубы, меняя ее длину; в кларнете, гобое, флейте, саксофоне длина трубы меняется при помощи закрытия и открытия отверстий и т. д.

Для музыкантов, которые записывают свои композиции дома, знание о наличии в любом помещении стоячих волн и понимание природы воздушного резонанса достаточно важно, так как позволяет с этими явлениями бороться. Например, если вы что-то записываете с микрофона в обычной жилой комнате, то микрофон ни в коем случае нельзя располагать прямо в центре помещения - иначе вы на записи получите искаженный стоячими волнами звук. С резонансами тоже можно бороться. Например, чем больше в вашей комнате отражающих непараллельных поверхностей, тем меньше условий для возникновения резонансов. Особенно важно обеспечить такие условия при записи с микрофона низкочастотных инструментов - контрабасов и басгитар.

Реверберация помещения

В разделе «Стоячие волны и резонанс» мы разобрали случай, когда звуковая волна встречает на своем пути перпендикулярную твердую поверхность. Однако, в любом помещении волны от источника звука распространяются во всех направлениях и многократно отражаются от стен и других препятствий. И только малое количество этих волн порождает стоячие волны и резонансы. Остальные отраженные волны воспринимаются слушателем как характерный гул, который называется реверберацией.

Временем реверберации называется время, в течение которого уровень отраженных волн падает на 60 дБ. Разумеется, у различных помещений это время будет разным. Однако оно не находится в прямой связи с геометрическими размерами пола, стен и потолков – бывает, что в большом зале время реверберации достаточно мало (когда, например, стены, пол и потолок покрыты пористым материалом, хорошо поглощающим звук), а в небольшой комнате, наоборот, - велико. Информацию же о размере помещения и расстоянии до источника звука нам приносят первые шесть-десять отраженных волн, которые называются ранними отражениями. А время в течение которого они приходят называют предварительной задержкой.

Кстати говоря, реверберация способна довольно сильно изменить тембр источника звука. Причем, с музыкальной точки зрения реверберация в одних помещениях может украшать звучание, а в других - портить. Зависит это от отражающих свойств поверхностей из которых изготовлены стены. Например, в спортивном зале с бетонными стенами реверберация имеет очень резкий и неприятный характер. Отражаясь от таких стен звуковые волны создают рассеянное эхо с сильным "свистящим" призвуком. И если вы запишите в таком помещении, предположим, акустическую гитару, то она будет звучать очень резко из-за реверберационного окрашивания.

А вот если вы принесете эту же гитару в комнату, где много отражающих поверхностей из неокрашенного дерева, то характер ее звучания изменится до неузнаваемости - она сразу заработает очень "тепло" и певуче. Решающую роль в такой метаморфозе сыграют акустические свойства помещения. Комнаты с деревянными поверхностями имеют очень приятную на слух, "мягкую" и "теплую" реверберацию - неслучайно в студиях звукозаписи очень часто стены обшиваются именно этим материалом.

Современные городские квартиры имеют как правило бетонные или кирпичные стены со штукатуркой, закрытые только слоем обоев. Реверберация в таких помещениях не способствует улучшению звучания музыкальных инструментов и голоса. Если вы хотите получить действительно качественную запись своего исполнения, то можете поступить двумя способами: либо поискать себе место для записи с хорошей акустикой, либо "заглушить" свою комнату и записывать только "сухой" голос или музыкальный инструмент, а реверберацию добавлять электронным способом при помощи процессора эффектов или компьютерной программы.

Обычно для "заглушения" комнаты используются любые ковры, одеяла и т.д. То есть, вы просто завешиваете стены любыми пористыми материалами, которые поглощают звук и не дают ему отражаться от стен.

Преобразование звуковых волн в электрический сигнал

С самого детства мы сталкиваемся с записями музыки на разных носителях - грампластинках, кассетах, компакт-дисках и т.д. Сейчас существует два основных способа записи звука: аналоговый и цифровой. Но для того, чтобы записать звук на какой-нибудь носитель (например, магнитофонную кассету), его нужно преобразовать в электрический сигнал.

Это делается с помощью микрофона. Самые простые микрофоны имеют мембрану, которая колеблется под воздействием звуковых волн. К мембране присоединена катушка, перемещающаяся синхронно с мембраной в магнитном поле. А из школьных уроков физики вы, вероятно, помните, что в такой ситуации в катушке возникает переменный электрический ток. Изменения напряжения тока точно отражают изменения плотности воздуха в звуковых волнах.

Переменный электрический ток, который появляется на выходе микрофона, называется аналоговым сигналом. Слово "аналоговый", применительно к электрическому сигналу, обозначает, что этот сигнал непрерывен по времени и амплитуде. Он точно отражает форму звуковой волны, которая распространяется в воздухе.

Уровень электрического сигнала

У любого бытового усилителя есть ручка громкости. С ее помощью вы изменяете уровень электрического сигнала, который подается на акустические системы, заставляя последние звучать тише или громче. Обычно в электронике для измерения уровня сигнала используются единицы напряжения: вольты или более мелкие единицы - милливольты. Однако в звуковых приложениях принято измерять уровень сигнала в уже знакомых вам по разделу «Уровень и громкость звука» логарифмических единицах - децибелах. Причем изменение уровня сигнала в усилителе на 5 дБ приводит к изменению уровня звука в акустических системах на те же самые 5 дБ. Это очень удобно, поэтому все измерители уровня как бытовых, так и профессиональных звуковых устройств показывают уровни в логарифмических единицах.

В электронике применяются отрицательные значения уровня, выраженного в децибелах. Шкала начинается с минус бесконечности (отсутствие напряжения) и доходит до нуля. Положительные значения уровня указывают на перегрузку звукового тракта и, соответственно, возникновение искажений. Если у вас есть кассетная дека с индикаторами уровня записи, то вы должны это знать: если уровень 0 дБ превышается, то светятся красные сегменты индикаторов.

Как и в случае со звуковыми волнами, значение изменения уровня переменного электрического сигнала в децибелах рассчитывается по формуле, знакомой вам из раздела « Уровень и громкость звука», только значения звукового давления (силы звука) меняются на значения напряжения: N=20lg U2/U1, где U2 и U1 - это конечное и начальное напряжение сигнала. За 0 дБ принято напряжение в 0.775 В.

Моно и стерео запись звука

Примерно до середины шестидесятых годов звук записывался на магнитофон при помощи одного микрофона, а воспроизводился с помощью одной колонки. Такой метод записи и воспроизведения - монофонический или моно - был хорош всем, кроме одного: в фонограмме отсутствовало привычное для нас пространственное звучание. Это создавало определенный дискомфорт при прослушивании, ведь наш слух имеет пространственную избирательность, то есть мы можем сосредоточиться на каком-то конкретном звуке. Когда же прослушивается моно фонограмма, нам гораздо труднее выделить детали - они просто маскируются за наиболее громкими звуками.

Поэтому сейчас стандартом является стерео запись и стерео воспроизведение фонограмм. В самом простом

случае запись производится с двух широко расставленных микрофонов на два независимых канала магнитофона. То есть, как бы имитируется процесс восприятия звука нашим слуховым аппаратом. При воспроизведении этой фонограммы через две широко расставленные колонки пространственная картина восстанавливается, при этом мы получаем гораздо лучшую детализацию. Наш слух получает более привычную звуковую картину, чем при моно записи.

Передаваемая в стерео фонограмме пространственная "картинка" называется стереопанорамой. В панораме можно четко выделить три положения: левое, правое и центр. Звук, находящийся в центре, будет одинаково громко воспроизводиться из двух колонок. Звуки, находящиеся в левом и правом крайних положениях, будут слышны только в одной из колонок. Все остальные положения в панораме будут воспроизводиться соответственно.

Представление сигнала в виде амплитудной и амплитудно-частотной характеристик

Когда мы разговариваем о звуковых электрических сигналах и их обработке, то удобнее показывать все происходящее на графиках. Чаще применяют два графика: амплитудный и амплитудно-частотный.

Первый показывает зависимость амплитуды сигнала от времени (Рис. 1). С его помощью очень удобно иллюстрировать все процессы воздействия на динамический диапазон сигнала. Кроме этого все современные компьютерные программы записи и обработки звука сразу представляют фонограмму в виде ее амплитудной характеристики. Все монтажные операции гораздо удобнее делать над таким графическим представлением сигнала: вы видите все паузы, начала и концы полезного сигнала и т.д.

Рис. 1

Амплитудно-частотная характеристика применяется в тех случаях, когда нужно посмотреть частотный спектр сигнала. Такой график показывает зависимость уровня сигнала от его частоты. Вы очень легко сможете посмотреть какой уровень имеет любая частотная полоса. С помощью амплитудно-частотной характеристики удобно иллюстрировать процессы корректировки тембра звука. А в практической работе полезно не только слушать результаты своих действий, но и визуально оценивать их.

Амплитудно-частотная характеристика может иметь два варианта представления. Часто используется двухмерный график, который иллюстрирует частотный спектр сигнала в определенный момент времени. Но в любой фонограмме спектр может меняться, например, в моменты вступления других музыкальных инструментов. Поэтому для его динамического представления используется трехмерный график амплитудночастотной характеристики, в который добавляется ось времени (Рис. 2). Вы можете посмотреть все изменения частотного спектра, которые происходят в фонограмме.

Рис. 2

В студиях звукозаписи для отображения амплитудно-частотной характеристики фонограмм используются приборы, которые называются анализаторами спектра (Рис. 2). Они, как правило, измеряют уровень 31 частотной полосы, которые располагаются через 1/3 октавы. Результаты измерений выводятся на дисплей в виде «столбиков», которые меняют свою высоту в зависимости от уровня той или иной полосы. Анализаторы спектра часто встраиваются и в бытовые музыкальные центры, однако в бытовом варианте они редко имеют больше 7-10 полос.

Рис. 3

Искажения звукового сигнала и помехи звукового тракта

Любая аудиоаппаратура (как любительская, так и профессиональная) не идеальна. Так или иначе, в звуковом тракте присутствуют различные помехи, а при передаче сигнала последний искажается. Хорошая аппаратура отличается от плохой лишь низким уровнем этих искажений и помех.

Идеальный звуковой тракт абсолютно линеен, то есть сигнал на входе точно соответствует сигналу на выходе. Но в реальных условиях такой точности достичь невозможно. В любых схемах сигнал на выходе немного отличается от входного. В таких случаях говорят, что звуковой тракт (звуковое устройство) привносит в звук нелинейные искажения.

Если у вас есть магнитофон с ручной регулировкой уровня записи, то вы можете услышать, как проявляют себя нелинейные искажения. При небольшом превышении уровня 0 дБ искажения практически не ощущаются. Если вы увеличите уровень записи, то звук начнет менять свой тембр. При еще большем увеличении в колонках появляются хрипы и явные искажения. Рис.1 иллюстрирует эти изменения сигнала.

Кстати говоря, с нелинейными искажениями отлично знаком любой гитарист, использующий в своей работе эффекты овердрайв и дисторшн. Они имитируют звучание перегруженного лампового усилителя. То есть, когда вы вращаете ручку Drive на эффекте, вы изменяете не что иное, как уровень нелинейных искажений.

Обычно производители указывают в спецификациях своих звуковых устройств величину коэффициента нелинейных искажений. Эта величина указывается для сигнала, уровень которого не превышает уровень 0 дБ, то есть не происходит перегрузки. Коэффициент нелинейных искажений показывает в процентах на сколько уровень чистого синусоидального сигнала с частотой 1000 Гц (не имеющего гармоник) больше уровня гармоник, добавляющихся к сигналу в результате нелинейности звукового тракта. В качестве ориентира можно дать такую цифру: мы не слышим нелинейные искажения, если их коэффициент не превышает 2-3%. У современной высококачественной аппаратуры коэффициент нелинейных искажений составляет десятые или сотые доли процента.

Теперь давайте поговорим о помехах в звуковом тракте. Они в любой аппаратуре гораздо сильнее портят фонограмму, чем нелинейные искажения. Помехи бывают трех видов: фон, внешние наводки и шум.

Фоном называется низкое однотонное гудение с частотой 50 или 100 Гц. Чаще всего его можно услышать в различных усилителях. Возникает фон в результате плохой фильтрации переменного тока питания. Другая причина возникновения фона - электромагнитные наводки со стороны близко расположенных сетевых шнуров другой аппаратуры. Но наводки проявляются не только в виде фонового низкочастотного гудения. Любые источники сильного электромагнитного излучения: компьютерные мониторы, телевизоры, трансформаторы, близко расположенные радиостанции и т.д. - способны оказывать на аппаратуру воздействие. Гитаристы часто слушают в своих акустических системах разные передачи радио - это одно из проявлений наводок.

В дорогих звуковых устройствах фон и наводки обычно отсутствуют. Этого добиваются, во-первых, при помощи хорошей фильтрации питающего тока, а во-вторых, применяя разного рода экраны - металлические кожухи, которые защищают устройства от электромагнитных наводок. На качественной аппаратуре наличие металлического, а не пластмассового корпуса - признак хорошей экранировки. Помимо узлов аппаратуры всегда экранируются соединительные шнуры, по которым передается электрический сигнал. Шнуры без экранировки представляют собой отличные антенны.

Шумом обычно называют однотонное шипение (вы наверняка хорошо с ним знакомы, если у вас есть дешевые магнитолы или другие недорогие звуковые устройства). Такое шипение еще называют иногда " белым шумом ". Это собственное шипение радиодеталей, и бороться с ним гораздо сложнее, чем с фоном. Высокая цена на качественную технику во многом объясняется тем, что в ней используются специально отобранные детали с низким собственным уровнем шума.

Практически во всех спецификациях звуковой аппаратуры вы найдете такой параметр как соотношение сигнал/шум. Это соотношение показывает насколько уровень шумов в звуковом тракте меньше полезного сигнала, имеющего уровень 0 дБ. Иногда в спецификациях приводится отрицательное значение уровня шума. Смысл такого представления точно такой же: это уровень шума относительно 0 дБ.

Для того, чтобы вам было легче ориентироваться в спецификациях, приведем следующие цифры. Соотношение сигнал/шум у современной магнитной ленты находится в районе 55-60 дБ, то есть любой магнитофон, воспроизводя эту ленту с отключенной системой шумоподавления, шипит именно на таком уровне. Граница уровня шумов у современной профессиональной звуковой техники находится на уровне 80 дБ. Лучшие звуковые карты, дорогие бытовые компакт-диск проигрыватели и минидисковые деки имеют схожее или лучшее соотношение сигнал/шум.

Однако все эти цифры справедливы только для шума, то есть собственного шипения радиодеталей, из которых собрано звуковое устройство. Соотношение сигнал/шум не учитывает фон и наведенные шумы. Поэтому реальный уровень шумов звуковой аппаратуры может иметь уровень гораздо больший, чем написано в спецификации. Особенно часто этим страдает дешевая техника, так как производители предпочитают не тратить деньги на экранировку и другие подобные "излишества". Поэтому цифрам соотношения сигнал/шум можно верить только для дорогой аппаратуры, которая заведомо хорошо экранируется и защищается от сетевых помех.

Чем цифровая запись лучше аналоговой?

Самым главным недостатком аналоговой записи на магнитную ленту является старение носителя. За год фонограмма, которая имела нормальный уровень высоких частот, может потерять их. Виниловые грампластинки имеют тот же самый порок - достаточно несколько раз проиграть их и качество уже не то.

Когда в начале 80-х годов появились компакт-диски, то одними из самых главных преимуществ нового носителя назывались долговечность и неподверженность механическому старению. Это не означает, что можно использовать CD в качестве подставки для чайника, а потом ставить в проигрыватель. Речь идет о чисто механическом износе во время воспроизведения. Теоретически, цифровой диск может служить вечно, если его не царапать и аккуратно обращаться.

Вторым важным преимуществом цифрового формата является отсутствие потерь при перезаписи. Если вы

переписываете понравившийся альбом с пластинки на кассетную деку, то качество звука ухудшается. Еще одна перезапись - и звук снова ухудшается. При цифровой перезаписи таких потерь нет. Вы можете копировать компакт-диск множество раз, однако никакого ухудшения фонограммы не услышите.

Последним достоинством цифровой техники является лучшее соотношение цена/качество. Качество звука у дешевого компакт-диск проигрывателя гораздо лучше, чем у дешевого "кассетника". Аналоговые магнитофоны, которые имеют звук, лучший чем у дешевых CD плееров стоят намного дороже. Поэтому покупатели делают совершенно разумный выбор в пользу цифровой техники.

Однако утверждение о том, что любая цифровая запись лучше, чем аналоговая не совсем соответствует действительности. Многие аналоговые магнитофоны записывают звук гораздо лучше, чем цифровые. Поэтому они до сих пор активно используются во многих профессиональных студиях. В некоторых ситуациях звукорежиссеры вообще однозначно отдают предпочтение аналоговой записи. Например, считается, что итоговую фонограмму (мастер) лучше записывать не на цифровой DAT магнитофон, а на двухканальные катушечные магнитофоны на скорости 38 см/с, и уже потом переводить в цифровой вид. Поэтому не думайте, что цифровая запись автоматически дает отличное качество звука.

Цифро-аналоговое и аналого-цифровое преобразование

Звуковые волны при помощи микрофона превращаются в аналоговый переменный электрический сигнал. Этот сигнал (Рис.1, схема 1) проходит через звуковой тракт и попадает в аналого-цифровой преобразователь(АЦП) - устройство, которое переводит сигнал в цифровую форму.

В упрощенном виде принцип работы АЦП можно описать так: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность чисел, несущих информацию об изменениях величины амплитуды (Рис. 1, схема 2).

Во время аналого-цифрового преобразования на самом деле никакого физического преобразования не происходит. С электрического сигнала как бы снимается отпечаток или образец, являющийся цифровой моделью колебаний напряжения в аудиотракте. На схеме 2 эта модель представлена в виде

последовательности столбиков, каждый из которых соответствует определенному числовому значению. На этой схеме видно, что цифровая модель не совсем точно соответствует форме аналогового сигнала. Поэтому говорят, что цифровой сигнал по своей природе дискретен - то есть, прерывист.

Промежуток времени между двумя измерениями амплитуды аналогового сигнала называется семплом (или «отсчетом» в отечественной литературе) С английского слово Sample дословно переводится как "образец". Поэтому это слово в мультимедийной и профессиональной звуковой терминологии имеет несколько значений, для обозначения разных видов "образцов". Кроме промежутка времени семплом называют любую последовательность цифровых данных, полученных в результате аналого-цифрового преобразования, а сам процесс преобразования – семплированием.

Вывод цифрового звука осуществляется при помощи цифро-аналогового преобразователя(ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды (Рис.1., схема 3). А в акустических системах этот сигнал преобразуется в звуковые волны, которые мы слышим.

Одним из двух ключевых параметров процесса оцифровки является частота семплирования (частота дискретизации) - количество измерений амплитуды аналогового сигнала в секунду. Так как диапазон колебаний звуковых волн лежит в пределах от 20 Гц до 20 кГц, то количество измерений сигнала в секунду должно быть больше, чем количество колебаний звуковой волны за тот же промежуток времени. На Рис.2. показано, что происходит, если частота семплирования гораздо ниже, чем частота звуковой волны: за время между измерениями амплитуда сигнала успевает несколько раз измениться, в результате чего цифровой отпечаток несет хаотичный набор данных. При цифро-аналоговом преобразовании такой семпл будет выдавать только шум, а основной сигнал передаваться не будет.

Рис 2

Поэтому для качественного преобразования применяют частоты более чем в два раза превышающие верхнюю границу звукового диапазона: 44.1 и 48 кГц. А в новом формате компакт-дисков под названием Audio DVD применяется частота семплирования 96 кГц. То есть за 1 секунду сигнал измеряется 96 тысяч раз!

В мультимедийных приложениях очень часто применяют меньшие частоты: 11, 22 и 32 кГц для экономии места на жестком диске. Но с уменьшением частоты семплирования сразу уменьшается слышимый диапазон частот, а то, что слышно - довольно сильно искажается. На Рис.3. представлены четыре графика, показывающие с одинаковым масштабом один и тот же звук высотой 1 кГц (этой частоте примерно соответствует нота До седьмой октавы фортепиано), но семплированный с разной частотой (нижняя часть синусоиды на всех рисунках не показана). Одно деление на горизонтальной оси, показывающей время, соответствует 10 семплам. Все эти рисунки были получены при помощи аудиоредактора Sound Forge 4.5.

Рис 3

Вы видите, что на частоте 11 кГц на каждые 50 семплов приходятся примерно 5 колебаний звуковой волны, то есть один период синусоиды отображается всего лишь при помощи 10 значений. При таком отображении ни о какой точной передаче говорить не приходится. Зато при частоте оцифровки 44 кГц на каждый период синусоиды приходится уже почти 50 семплов - такая точность отображения позволяет получить сигнал хорошего качества.

Теперь давайте разберемся с другим ключевым параметром цифрового преобразования - разрядностью семплирования. Этот параметр указывает, с какой точностью происходят измерения амплитуды аналогового сигнала.

Посмотрите еще раз на Рис 1. Точность, с которой при оцифровке передается значение амплитуды сигнала в каждый из моментов времени («столбики» на схеме 2), фактически определяет качество сигнала после цифро-аналогового преобразования. От этой точности зависит достоверность восстановления формы волны.

Любое цифровое устройство, в том числе и компьютер на аппаратном уровне может оперировать только с двоичным кодом. Этот код позволяет представить любую информацию в виде нулей и единиц. Такой способ обмена информацией гораздо проще реализовать технически - ведь любое цифровое устройство представляет собой электрический "ящик". Например, одна величина напряжения соответствует нулю, а другая величина - единице. Сделайте побольше разницу между этими двумя величинами и вероятность ошибки практически сводится к нулю. А если бы тот же компьютер на аппаратном уровне оперировал десятичными цифрами, нам пришлось бы вводить десять значений напряжения, чтобы закодировать цифры с 0 до 9. Это уменьшает надежность системы.

Минимальной информационной единицей в двоичной системе является бит(иногда его называют «разрядом») Он может принимать два значения - 0 и 1, то есть одним битом можно представить два десятичных числа. Двумя битами - уже четыре числа (используя все возможные комбинации нолей и единиц: 00, 01, 10, 11). Тремя битами - восемь чисел и т.д.

Именно такой принцип и применяется для кодирования значения амплитуды сигнала. Обычно используется 8 или 16 битное представление значений амплитуды. Давайте остановимся на этом моменте подробней.

Если при оцифровке используется 8-битное кодирование, то измерения амплитуды аналогового сигнала будут производиться с точностью до 1/256 от динамического диапазона цифрового устройства (8 бит позволяют представить 28 чисел - 256). Такая точность недостаточна для достоверного восстановления исходного сигнала: будут велики нелинейные искажения. Поэтому 8-битное кодирование применяется преимущественно в мультимедиа-приложениях, где не требуется высокое качество звука.

Если же мы повысим разрядность представления значений амплитуды аналогового сигнала до 16 бит, то точность измерения возрастет не в два раза, а в 256. Ведь 16 бит позволяют закодировать уже 216=65536 значений амплитуды. Такая точность кодирования позволяет нелинейные искажения свести к минимуму. Именно разрядность 16 бит используется при записи компакт-дисков.

В современных же преобразователях используется 24-битное кодирование сигнала. Такая разрядность позволяет получить 224=16777216 значений амлитуды, что более чем достаточно для высококачественной оцифровки звука.

Здесь надо остановиться и поговорить об одной особенности оцифровки. Все приведенные выше данные справедливы только для сигнала, имеющего максимальный уровень 0 дБ. Если преобразуется сигнал, имеющий уровень -6 дБ с разрядностью 16 бит, то реально для кодирования его амплитуды будет оставаться 15 бит. Для сигнала с уровнем -12 дБ эта цифра будет составлять 14 бит. То есть с уменьшением уровня сигнала будет уменьшаться разрядность его оцифровки и, соответственно, увеличиваться уровень нелинейных искажений (в технической литературе эти искажения иногда называются шумом квантования). Уменьшение уровня на каждые 6 дБ будет "съедать" 1 бит. В результате, для кодирования амплитуды сигнала с уровнем -90 дБ у нас останется всего 1 бит.

Этот недостаток 16-битного кодирования и является основным катализатором введения нового бытового цифрового формата Audio DVD, у которого помимо частоты семплирования 96 кГц используется разрядность 24 бита. Ожидается, что через несколько лет он полностью вытеснит с рынка обычные компакт-диски.

Теперь давайте подсчитаем, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе. Если мы записываем моно сигнал с частотой 44.1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 44100х2х60=5292000 байт, т.е. около 5 Мб данных об амплитуде аналогового сигнала, которые в компьютере записываются на жесткий диск. Стерео сигнал уже будет занимать 10584000 байт или около 10 Мб. Объем данных для 11, 22 или 32 кГц вы можете подсчитать самостоятельно.

Продолжаем знакомиться с формами представления музыки в компьютерных программах. В

предыдущем выпуске журнала мы рассмотрели нотатор, отпечатки клавиш, виртуальный гитарный гриф и отпечатки пальцев. И это были еще цветочки. А сегодня наступило время ягодок. Речь пойдет о списке сообщений, привилегированных системных сообщениях, треках и клипах.

Список сообщений

Если ноты - язык общения музыкантов, то список сообщений - это привычная среда работы программистов.

Каждое сообщение (Event) занимает в списке одну строчку и, по существу, представляет собой указание, которое должен выполнить музыкальный компьютер в определенный момент времени.

Для MIDI-редактора сообщения - это наиболее естественная форма представления музыкальной информации. Более того, MIDI-система способна принимать и выполнять только те сигналы, которые являются MIDI-сообщениями. Вы записываете ноты, наносите отпечатки клавиш и пальцев, а компьютер, в конечном счете, все равно преобразует их в сообщения.

Что ж это за такой страшный зверь - сообщение? На самом деле MIDI-сообщения - это всего лишь закодированные числами команды органам управления синтезатором - контроллерам. Наиболее часто встречаются команды Note On (включить звучание определенной ноты в такой-то момент времени с такой-то громкостью) и Note Off (выключить звучание ноты в такой-то момент времени). Вы помните, что все MIDI-ноты пронумерованы от 0 до 127.

Кроме этих команд MIDI-сообщения могут содержать указания о смене инструмента, перестройке частотного фильтра, нажатии педали, виде и глубине эффекта, а также многое другое. Соответствие чисел командам стандартизировано. Правда, одновременно имеют хождение целых три стандарта: GM, GS и XG (см. "Магия ПК", 2001 № 3). Смысл основных команд в них, к счастью, совпадает.

Стандарты стандартами, но они не должны сдерживать прогресс. Продвинутые фирмы-изготовители стремятся предоставлять пользователю все новые и новые возможности управления синтезом. Для расширения функций синтезатора в MIDI предусмотрено несколько путей. Один из них -сообщения типа NRPN (нерегистрируемые параметры). Если разработчик придумывает что-нибудь эдакое, что не предусмотрено стандартом, то управление этим "чем-нибудь" можно осуществлять посредством

NRPN.

В документации на звуковые карты сведения об NRPN приводятся в виде таблиц, в которых в шестнадцатеричной системе счисления содержатся значения младшего (LSB) и старшего (MSB) байтов номеров NRPN. А редакторы MIDI-сообщений, в частности, Event List программы Cakewalk Pro Audio требуют вводить номер NRPN в виде одного десятичного числа. Мне доподлинно известно, что многие музыканты отказываются от попыток использования расширенных возможностей синтеза из-за неспособности преодолеть это несоответствие. Вычисляют десятичное значение необходимого NRPN, с помощью окна Event List посылают это сообщение, и… никакой реакции со стороны синтезатора. Дело вовсе не в том, что некоторые "лирики" не в ладах с "физикой" и не знают, как перевести число из одной системы счисления в другую. Эта проблема решается элементарно, например, с помощью стандартного калькулятора MS Windows. Все сложнее и, в то же время, проще. Суть состоит в том, что посылают они сообщения буквально "на деревню дедушке", промахиваясь мимо требуемого адреса, как минимум, на 256 "домов".

"Магия ПК" - это интересно, а вот магия стереотипов - страшное дело. Все привыкли думать, что байт - это 8 бит. Однако в байте MIDI-сообщения один бит не является значащим, это бит статусный, говорящий о том, какая информация передается - MIDI-команда или MIDI-данные. По этой причине вес младшего бита старшего байта (MSB) составляет не 256, а 128. Вот и весь секрет, о котором и вы теперь будете знать. Правда, это только один из сотен секретов успешной работы над музыкой с помощью компьютера. Еще парочку тайн я выдам сегодня, а о других - в следующих выпусках журнала.

Редактор MIDI-сообщений есть в музыкальной программе каждой уважающей себя фирмы. Разработчики же программы Cakewalk Pro Audio пошли еще дальше. В окне Event List, можно редактировать не только MIDI-сообщения, но и сообщения еще нескольких типов. Среди них: тексты песен, обозначения аккордов, параметры действия символов крещендо и диминуэндо, команды воспроизведения звуковых файлов, команды управления любым мультимедийным оборудованием компьютера, привилегированные системные сообщения, позволяющие добраться до самых дальних закоулков синтезатора.

Рис. 1. Окно Event List - список сообщений

Список сообщений - это таблица. В ячейках таблицы содержится время выполнения сообщения, его тип и параметры. Редактирование содержания таблицы производится мышью с помощью меню и полей ввода.

С помощью окна Event Manger вы можете избирательно выводить на экран сообщения любых необходимых типов (рисунок дает наглядное представление о типах сообщений, поддерживаемых программой Cakewalk Pro Audio).

Рис. 2. Окно Event Manger

А если, скажем, вы захотите поместить над нотным станом символы табулатур (сообщения типа Chord), то достаточно вызвать окно редактора аккордов, а уж в нем найдется любое разрешенное теорией гармонии звукосочетание, представленное в графическом виде.

Рис. 3. Редактор аккордов

В ряду типов MIDI-сообщений особый статус принадлежит привилегированным системным сообщениям (Sysx). Посредством них осуществляется управление большинством неочевидных ресурсов любого синтезатора. Доступ к нестандартным контроллерам управления параметрами синтеза, регистрам синтезатора, эффект-процессору, загрузка в память синтезатора установок патчей и даже целых сэмплов - основой всего этого являются привилегированные системные сообщения.

Можно сказать, что все прочие MIDI-сообщения обеспечивают соответствие звуковой карты или синтезатора минимальным требованиям, а NRPN и особенно Sysx наращивают ваши возможности управления звуком сверх предусмотренных стандартом.

О том, какие системные сообщения "понимает" ваш синтезатор, можно узнать, прочитав его техническое описание. Для их редактирования пересылки и приема в Cakewalk Pro Audio предназначено специальное окно Sysx, представленное на рисунке.

Рис. 4. Работа с банками системных сообщений

Пользуясь этим окном, вы можете либо манипулировать банками системных сообщений, либо редактировать содержание отдельного системного сообщения. Во втором случае вам опять придется иметь дело с последовательностью шестнадцатеричных чисел.

Рис. 5. Редактирование содержания системного сообщения

Авот и еще один из обещанных секретов. Системное сообщение обязательно должно начинаться с шестнадцатеричного числа F0 и заканчиваться числом F7. Это границы системного сообщения. А его "начинка" определяется типом синтезатора и смыслом передаваемой информации. Например, сообщение F0 43 10 4C 02 01 00 13 00 F7 правильно поймет только синтезатор звуковой карты стандарта XG (принадлежность синтезатора к детищам славной фирмы Yamaha закодирована числами 43 10 4C). И означает оно, что для эффект-процессора выбран вариант реверберации, имитирующий акустическую обстановку мрачного подземелья.

Атеперь раскрою третий даже не секрет, а небольшой такой секретик. Системные сообщения часто хранятся в MIDI-файлах и загружаются вместе с ними. Почти наверняка в начале каждого файла, "скачанного" из INTERNET, хранится сообщение о системном сбросе. Так вот, подобные сообщения для звуковых карт, соответствующих стандартам GM, GS и XG, различны. И если вдруг при воспроизведении очередная отлично знакомая вам MIDI-композиция звучит не похоже на саму себя, очень может быть, что в предыдущей композиции содержалось сообщение о сбросе для другого стандарта, а не того, что поддерживается вашей звуковой картой. Как с этим бороться? Либо записывайте в начало всех ваших композиций одно из системных сообщений GMSYSTEM.SYX, GSRESET.SYX, XG-RESET.SYX (то, которому соответствует ваша звуковая карта), либо посылайте его в реальном времени перед воспроизведением очередной композиции с помощью окна Sysx.

Техника работы со списком сообщений и редактором системных сообщений не сложна. Главное заключается в другом: нужно знать, какое именно сообщение и с какими параметрами уместно в том или ином случае. В краткой статье об этом рассказать невозможно. Необходимо, как минимум, несколько десятков страниц. Могу посоветовать обратиться к нашей книге "Cakewalk Pro Audio 9. Секреты мастерства", в ней вы:

Найдете материал о сообщениях, которыми можно изменить диапазон колеса перестройки тона, переключить тип реверберации и хоруса в MIDI-устройствах фирм Roland и Yamaha, в звуковых картах SB Live! и Turtle Beach Tropez Plus

Узнаете, что такое регистрируемые и нерегистрируемые параметры, и как с их помощью управлять контроллерами, в явном виде недоступными

Познакомитесь с методикой безошибочного вычисления номера контроллера по его младшему и старшему значащим байтам с использованием калькулятора MS Windows для перевода чисел из шестнадцатеричной в десятичную систему счисления и обратно

Конечно, можно и не пытаться освоить редактирование сообщений, а работать только с нотами и отпечатками клавиш. Но, во-первых, без редактирования сообщений вам не удастся точно установить значения многих параметров синтеза звука, значит, и в музыке ваш замысел до конца не

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]