Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по Техники и технологии СМИ_1 курс NEW.doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
725.5 Кб
Скачать

Лекция 7 Аналоговая и цифровая звукозапись

План

  1. Основные принципы звукозаписи.

  2. Аналоговая магнитная запись.

  3. Цифровая магнитная запись.

  4. Запись на CD.

  5. Flash-карты. Их преимущества.

1. Звукозапись – это процесс переноса звуковых сигналов с помощью специальных устройства на движущееся тело. В процессе звукозаписи изменяется физическое состояние или форма поверхности материала. Эти изменения могут быть подобны форме звукового сигнала – такую запись называют аналоговой. Запись можно вести, применяя кодовые посылки – это кодовая запись. Материал, используемый при звукозаписи и сохраняющий интересующую нас информацию, называется носителем записи. След на носителе после записи звуковой информации в виде череды аналоговых или кодовых изменений физического состояния материала называют фонограммой, а место расположения фонограммы на носителе – дорожкой. Воспроизведение – процесс, обратный звукозаписи, его конечная цель – восстановление сигналов звуковой информации.

2. Аналоговая магнитная запись. До появления МЗ звука еще в 1877 г. Т. Эдисон патентует фонограф – устройство, в котором пишущая игла, управляемая мембраной, оставляла след на валике с оловянной фольгой. На основе фонографа в дальнейшем был изобретен граммофон и др. приборы с механической записью.

Первоначально мех. запись велась на покрытых воском валиках, потом на дисках, но во всех случаях исп-лся один и тот же принцип. К некой диафрагме крепится перо или иголка. Под действием звуковых колебаний диафрагма перемещается – игла соотв-но режет канавки с глубиной, изм-ния кот. повторяют форму записанного сигнала. Позже перешли к системе записи с поперечным перемещением иглы, размах которых пропорционален уровню звука. При воспроизв-ии игла скользит вдоль канавки и перемещ-ся в соотв-вии с ее искривлениями или изм-нием глубины. Игла толкает диафрагму, кот. повт-ет движения при записи звука. Перемещения диафрагмы воспроизводят соответствующие вариации давления, существовавшие в момент записи звука. Рассмотренная схема мех. записи звука оказалась на редкость консервативной от Эдисона до наших дней, хотя и претерпела многие конкретные изм-ния, главная цель кот. всегда заключалась в повышении степени подобия сигналов на входе и выходе. А это требовало расширение частотного интервала записи/воспроизведения, снижения шума и коэф-та Нелин. искажений. Примером массового тиражирования фонограмм, выполненных на основе механич. записи, явл-ся широко распр. граммофонные пластинки. Процесс производства грамм. пластинок довольно сложный.

Принципиально новый способ записи в 1989 г. предложил датский изобретатель Вальдемар Паульсен (1869-1942), работавший в телефонной компании. К тому времени было известно о свойствах ферромагнитных материалов сохранять остаточное намагничивание, соответствующее напряженности магнитного поля, т.е. при изменении параметра внешнего магнитного поля намагниченность материала изменялась и сохранялась неограниченное время. Запись выполняется с помощью специального устройства – записывающей магнитной головки, возбуждающей переменное магнитное поле. Относительно этой головки и в контакте с ней перемещается носитель с ферромагнитным рабочим слоем. На этом слое остается след остаточного намагничивания. След – это дорожка записи, остаточное намагничивание – сигналограмма, в устройствах записи звука – фонограмма. Считывание фонограммы – процесс, обратный рассмотренному. Магнитное поле носителя, перемещающегося относительно считывающей головки, возбуждает в ней индукционный электрический ток – фактически звуковой электрический сигнал. В качестве носителя информации В. Паульсен выбрал стальную проволоку, а в качестве преобразователя звука – телефонный микрофон. В.Паульсен совершенствует лентопротяжный механизм, чтобы проволока могла наматываться на катушки, и магнитная головка оставалась неподвижной. Вскоре телеграфон мог записывть звук с продолжит-тью 30 мин., но чрезмерн. уровень шума и неудобство работы с проволокой привели к тому, сто в 1918 г. производство телеграфонов было полностью прекращено.

Широкое распространение магнитная запись получает в 30-е гг. ХХ века, после того как немецкая компания BASF разрабатывает специальную долговечную и простую в обращении ленту на ацетатной основе, покрытую ферромагнитным порошковым слоем.

Основным недостатком МЗ являются шумы, возникающие из-за звуконосителя: мельчайшие частицы ферромагнитного порошка располагаются на лавсановом слое ленты неравномерно, соответственно возникает магнитная неоднородность (структурные шумы), кроме того, механический контакт ленты с магнитной головкой (записывающей или воспроизводящей) неодинаков (контактные шумы).

3. Цифровая магнитная запись. Основным достоинством ЦМЗ являетсяся отсутствие шумов ленты. Контактные и структурные шумы при ЦЗ группируются для дальнейшего исправления. Помимо ленты в качествве звуконосителя может использоваться магнитный диск, основные достоинства которого – осуществление записи только на бездефектные участки, т.к. перед использованием диск форматируется и некачественные места поверхности становятся недоступными.

Еще один широко распространенный носитель цифровой магнитной записи – это минидиск (MiniDisc). Это тот же стандартный размер в 3.5 дюйма, твердая основа и магнитное покрытие. Оформлен в виде кассеты, в основном применяется как внешний носитель. MiniDisc - формат для записи и воспроизведения цифровой аудиоинформации, разработанный компанией "Sony". Данный формат был впервые представлен в 1991 году, а первые серийные MD-устройства появились в 1992 г.

Минидисковые устройства позволяют:

- вести запись с цифровых источников (CD-плеер и т.п.) без преобразования в аналоговый формат;

- записывать звук с аналоговых источников, оцифровывая его в режиме реального времени;

- редактировать запись, добавляя и удаляя дорожки;

- осуществлять цифровой монтаж без потери качества звука;

- записывать текстовые пояснения к аудиотрекам (титры), ставить дату и время записи;

- осуществлять мгновенный переход к любой записи.

4. Запись на CD. Обычный компакт диск представляет собой поликарбонатную основу. На эту основу методом штамповки наносятся направляющие дорожки и углубления в дорожках - питы (англ. pit - углубление), несущие информацию о звуке в цифровом виде. После штамповки на основу наносятся отражающий алюминиевый слой и защитный слой. При считывании луч лазера отражается от областей диска, в которых нет углублений, и не отражается от областей с углублениями. Таким образом, с диска считывается информация о звуке, записанном в цифровой форме. Если на отражающем слое находится «дырка», считывающее устройство понимает ее как цифру «1», ее отсутствие – как «0». В перезаписываемых CD (CD-RW ReWriteteble CD-R Recordable) вместо металлизированного отражательного слоя находится спец. вещество, способное многократно изменять свою структуру. Под действием лазерного луча на поверхность слоя происходит его переход из кристаллического состояния в аморфное и наоборот.

Записываемые компакт диски сделаны по аналогичной технологии. На поликарбонатную основу нанесены направляющие дорожки. Затем идет слой органического красителя, который темнеет при нагревании, и отражающий слой из серебряной или золотой пленки. Отражающую пленку защищает сверху поликарбонатный защитный слой.

Запись на такой диск осуществляется специальным лазером повышенной мощности. Лазер посылает кратковременный мощный импульс, который разогревает область на диске между направляющими дорожками. Температура этой области достигает 250º С, в результате чего темнеет органический краситель. На диске появляются темные области, аналогичные углублениям (питам) на обычном компакт диске.

CD-R диски записываются один раз и не могут быть перезаписаны (некоторые записывающие устройства могут дозаписывать не полностью заполненный информацией диск). Технология CD-RW (Compact Disc ReWritable) позволяет не только записать информацию на диск, но и перезаписать ее в будущем. В дисках, выполненных по технологии CD-RW, слой органического красителя заменен на сплав серебра (Ag), индия (In), сурьмы (Sb) и теллура (Te). Для облегчения нагрева этот слой расположен между двумя диэлектрическими слоями.

Сплав Ag-In-Sb-Te при комнатной температуре может находиться в двух состояниях - кристаллическом и аморфном. Исходное состояние записывающего слоя - кристаллическое. При записи область диска нагревается кратковременным мощным импульсом лазера до температуры 500 - 700º С (выше температуры плавления). Записывающий слой в этой области переходит в аморфное состояние. Аморфные области аналогичны питам на обычном компакт диске. При воспроизведении луч лазера отражается от областей диска с кристаллической структурой записывающего слоя и почти не отражается от областей с аморфной структурой.

На CD аудиоданные располагаются в виде бинарных логич. единиц. Один слой диска представляет прозрачн. подложку, второй – отражающий слой. Если сравнивать CD с трад. аналоговой грамзаписью, становится заметным множ-во преимуществ. Прежде всего – высокое кач-во звука. Поскольку считывание оптическое (при пом. лазера) и практически без механ. контактов, CD практически не изнашиваются. При малых размерах доступное время воспроизведения звуковых программ заметно превосходит все возможное для механ. систем. Не удив-но, что CD быстро завоевали рынок, вытеснив с него обычные грампластинки. Стартовав на рынке бытового воспроизведения звука, CD постепенно стали осваивать и профессиональный. Сдерживающим началом здесь было то, что подобно грампластинкам, CD предлагали неизменяемую программу, тиражируемую с пом. пресса. Появление дисков в начале с возм-стью однократной, а затем и многократной записи сущ-но изменило ситуацию. Широкие возможности автоматизации процессов воспроизведения цифровых грампластинок, благодаря исп-нию в них кодов упр-ния и отображения инф-ции, а также малому времени доступа к заданному фрагменту фонограммы, стали если и дополнительными, но и весьма весомыми аргументами проф. применения лазерных дисков в звуковых студиях – фондовых записей, радиовещания, телевидения. (Лазер – аббревиатура англ. фразы Light Amplification Stimulated Emission of Radiations или нашему “вынужденное излучение света с усилением”).

В процессе записи, считывания или поиска требуемого фрагмента фонограмм оптич. головка перемещается в радиальном напр-нии. Положение внутрен. дорожки, с кот. нач-ся запись, отыскивается автоматически. При радиальном перемещении считывающегося устройства ведется счет пройденных дорожек; при этом считывающее устройство можно быстро установить на любую из 41250 дорожек. Диаметр внутренней дорожки 50 мм, а внешней 116 мм. То., длина дорожки, приходящаяся на один оборот диска непрерывно меняется. Чтобы сохранить постоянной линейную скорость перемещения светового пятна вдоль дорожки или, что тоже самое, продольную плотность записи надо менять частоту вращения диска, снижая её примерно с 500 об/мин на внутренней дорожке до 200 об/мин на внешне. Частота вращения опр-ся спец. схемой упр-ния по тактовым импульсам, появляющимся при пересечении следящим световым пятном форматирующего профиля. По этим импульсам опр-ся номер дорожки, с кот. ведется считывание.

Некомпрессированная запись в течение одной минуты может занять 10 Мб дискового пространства, но поскольку часть информации избыточна (за пределами порога слышимости), её можно сжать в 5 и более раз при помощи алгоритма сжатия MPEG. При этом следует учесть, что чрезмерное сжатие информации ухудшает качество звучания.

Этот самый популярный на сегодняшний день цифровой формат аудиосжатия был разработан небольшой немецкой фирмой "Fraunhofer IIS". Европейская корпорация "Thomson" активно поддержала новоявленный формат и приложила все усилия к его быстрейшему распространению. Данный формат использует крайне сложный алгоритм кодирования. В отличие от обычных архиваторов, которым нужно сжать информацию таким образом, чтобы после извлечения из архива в ней не изменилось ни одного бита, MP3 преследует несколько иные цели. Помимо математических алгоритмов сжатия, в этом формате присутствует также сложнейший алгоритм удаления ненужной звуковой информации, основанный на психолого-физиологических особенностях организма человека. Подавляющее число кодеков выбрасывает звуки, которые считаются выходящими за порог слышимости человека. При этом за значение порога принимается величина равная 16 kHz. Несмотря на то, что этот порог признан азбучной величиной и вписан во все учебники по физике, этот подход неверен. Люди весьма разнообразны по своим физиологическим особенностям, и у некоторых слуховой порог запросто может превышать эту среднестатистическую величину. Также многое зависит от интенсивности сигнала. Следовательно, удаление частот выше 16kHz абсолютно неприемлемо для файлов претендующих на CD качество (с высокой шириной потока), но вполне уместно для файлов с низкой шириной потока, где качество приносится в жертву размеру.

Другим критерием, по которому оценивается "ненужность" звука, является условие основанное на такой особенности человеческого слуха, как неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, причем этот уровень различен для разных частотных диапазонов. При использовании психоакустической модели кодирования MP3 CODEC автоматически выбрасывает маломощные, неслышимые частоты. К сожалению, опять таки, люди не одинаковы и те, кто в состоянии различить именно эти частоты, часто жалуются на потерю качества звучания при кодировании, тогда как среднестатистическое большинство этого не замечает.

Но самой главной особенностью психоакустической модели кодирования MP3 является так называемый эффект маскирования. Именно благодаря этому эффекту удается так сильно сжимать исходные аудиоданные. Суть этого эффекта в том, что слабый сигнал одного диапазона частот зачастую маскируется более мощным сигналом соседнего диапазона, если он присутствует в аудиозаписи, или мощным сигналом, предыдущего фрейма. Этот сильный сигнал вызывает временное понижение чувствительности уха к сигналу текущего фрейма. По сути, имеет место явление "временного оглушения". Для каждого звукового диапазона определяется величина маскирующего эффекта, создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма. Если маскирующий сигнал превышает мощность сигнала текущего диапазона, то данный диапазон сигнала не кодируется, что позволяет психоакустической модели удалить часть данных из этого фрейма. Для оставшихся данных каждого диапазона определяется, сколькими битами на фрейм можно пожертвовать, чтобы потери от дополнительного квантования были ниже величины маскирующего эффекта.

Качество MP3 определяется шириной потока (Bitrate), т.е. количеством бит, использующихся для кодирования звукового потока. Ширина потока измеряется в kbs (число килобит в секунду).