Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР5 ЗВУКОВА КАРТА.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
552.45 Кб
Скачать

DirectX і звукові адаптери.

Microsoft DirectX являє собою цілу серію програмованих інтерфейсів додатки (Application Program Interfaces - API), які впроваджуються між мультимедійними додатками і апаратними засобами. На відміну від програм MS DOS, розробникам яких доводилося забезпечувати апаратну підтримку з численними моделями і марками звукових плат, відеоадаптерів та ігрових контролерів, в Windows використовується інтерфейс DirectX, взаємодіє безпосередньо з пристроями апаратного забезпечення. Це підвищує ефективність програм і звільняє розробників від необхідності змінювати параметри додатків при роботі з різними пристроями, так як можна використовувати різні підпрограми універсального інтерфейсу. DirectX є гарантією того, що нові звукові плати та набори мікросхем системної логіки будуть належним чином працювати з різними версіями Windows.

Програми роботи зі звуком.

Мінімальний набір звукового ПО входить до складу ОС Windows - найбільш поширені драйвери звукових плат, кодеки, CD-плейер і Універсальний програвач (Media Player), найпростіша програма запису, програвання і редагування звуку в WAV-форматі (Фонограф або Sound Recorder), а також програма-мікшер, що забезпечує управління вхідним і вихідним мікшерами звукової плати під час відтворення і, відповідно, запису звуку. Ці програми використовують драйвери, встановлені для звукової плати.

Рис. 6. Windows Media Player

Разом зі звуковими платами поставляється більш розвинений набір звукового ПЗ. Це також драйвери, кодеки, мікшери та більш досконалі програми запису, програвання і редагування звуку в WAVE-та MIDI-формах (часто ці програми не встановлюються на машинах з іншими звуковими платами). Крім того, поставляється прикладне ПЗ - програми розпізнавання мовних команд, створення простих музичних композицій і т.п. Методи роботи з усіма цими програмами достатньо прості й очевидні.

Часто доводиться використовувати кілька звукових програм одночасно. Так, під час запису WAV-файлу з аудіо диска необхідні CD-плейєр, програма-мікшер (а то й два - для відтворення і для запису) і програма звукозапису, що дозволяє задати всі потрібні параметри оцифровування звуку і відредагувати результат.

Професійне звукове та музичне ПЗ досить дороге і призначене для більш складної обробки цифрового звуку в обох формах. У такому ПЗ часто використовуються складні методи штучного інтелекту. Робота з ним вимагає спеціальної професійної підготовки (музиканта, інженера-акустика).

Канали звуку.

Звичайні звукові плати дозволяють використовувати 1 або 2 звукових каналів (доріжок) WAVE-звуку - "моно" і "стерео". Обидва канали обробляються окремо за однаковими алгоритмами, хоча й одночасно. Тому немає принципових обмежень на кількість каналів. Збільшення числа каналів веде до пропорційного збільшення обсягу пам'яті, займаної звуковою інформацією.

Компресія звуку.

Позначимо

  • W - обсяг пам'яті в байтах для зберігання 1 секунди звуку в WAVE-формі,

  • w - швидкість потоку звукових даних в WAVE-формі в біт / сек,

  • H - частоту дискретизації (число вибірок в секунду),

  • B - розрядність квантування (число розрядів на вибірку),

  • C - кількість каналів.

Тоді очевидно, що w = HBC і, якщо B кратне 8, W = w / 8. Отже,

  • швидкість потоку даних CD-якості (H = 44100, B = 16, C = 2) становить 1411200 біт/с або 1378,125 Кб/с (така швидкість забезпечується тільки CD-дисководом з не менш, ніж 2-кратною швидкістю ),

  • 1година звуку з якістю CD-DA зажадає 605,6 Мбайт (тому на аудіо диску розміщується близько 70 хвилин звуку без компресії),

  • швидкість потоку даних телефонного каналу (H = 8000, B = 8, C = 1) складає 64 000 біт/с або 62,5 Кб/с (така швидкість забезпечується далеко не кожним модемом), отже такий звук не може використовуватися в Інтернет- телефонії).

З метою зменшення обсягу й потоку звукових даних в WAVE-формі використовуються різні спеціальні алгоритми компресії/декомпресії (кодеки), тому що звичайні алгоритми стиснення інформації тут не ефективні. Стиснення аудіо даних можливе лише з деякою втратою інформації, але через особливості сприйняття звуку людиною ці втрати практично не є непомітними. Найбільш відомими є кодеки, що використовуються в мультимедіа під Windows:

  • PCM (Pulse Code Modulation) - імпульсно-кодова модуляція (ІКМ) - стиснення може досягатися тільки за рахунок вибору менших значень величин H, B і C; квантування відбувається за рівномірною шкалою з 2B значень;

  • DPCM (Differential PCM) - диференціальна ІКМ (ДІКМ) - вибірка представляється своєї різницею від попередньої, що вимагає менше B бітів; стискає в кілька разів;

  • ADPCM (Adaptive DPCM) - адаптивна ДІКМ (АДІКМ) - те ж, що ДІКМ, тільки квантування відбувається не за рівномірною шкалою, а з урахуванням динаміки змін амплітуди; стискає в кілька разів;

  • MPEG (Motion Picture Experts Group) - стандарти Групи експертів у галузі кіно; для стиснення звукової інформації використовуються стандарти MP2;

  • MP3 - застосовується психо акустична компресія, при якій віддаляються звуки, які не сприймаються людським вухом, стискає в кілька десятків разів при досить високій якості;

  • ReаlAudio - метод, розроблений фірмою RealNetworks, стискає в кілька десятків разів, але з невисокою якістю; використовується в Інтернеті для відтворення звукових файлів в реальному часі. Для цифрової телефонії використовуються, як правило, інші кодеки.  Формати WAVE-файлів.

Часто кодек визначає і формат аудіо файлу, і, відповідно, його розширення:

  • MPEG - ". Mpa", ". Mp3",

  • RealAudio - ". Ra", ". Rm".

Більш гнучким є WAV-формат для Windows (файли з розширенням ". Wav"). У його основі лежить формат RIFF (Resourse Interchange File Format), що дозволяє зберігати довільні дані у структурованому вигляді. Для запису звуку в цьому форматі можуть бути використані різні кодеки. У форматі RIFF файли діляться на блоки даних (Chunks), що містять число байтів, кратне 4. Кожен блок починається з 4-байтового ідентифікатора, за яким слідує 4 байти з довжиною блоку або файлу. При необхідності блок доповнюється нульовими байтами, але розмір вказується без урахування цих байтів.

WAV-файл складається з трьох блоків - двох заголовних та одного блоку звукових даних. Перший блок має ідентифікатор "RIFF", за яким в 4-х байтах слідує розмір файлу (без урахування перших 8 байтів). У наступних 4-х байтах варто ідентифікатор "WAVE", який вказує тип RIFF-файлу. Наступний заголовний блок містить байтів в наступному порядку:

4 байти - ідентифікатор "fmt_" 4 байти - число 16 (розмір даних блоку) 2 байти - інформація про кодеку (1 для PCM) 2 байти - число каналів (1 - моно, 2 - стерео) 4 байти - частота дискретизації (при 44100 Гц - AC44H) 4 байти - число байтів в секунду, рівне W, якщо B кратне 8 2 байти - число байтів на один відлік, рівне BC / 8, якщо B кратне 8 2 байти - число бітів на вибірку B (якщо B не кратне 8, то вибірки доповнюються нулями до цілого числа байтів).

Останній блок - дані відліків - починається ідентифікатором "data", за яким розташовано 4 байти - розмір блоку, а потім самі дані. У разі стерео відліку дані для обох каналів слідують один за одним: спочатку вибірка для лівого каналу, потім вибірка для правого і т.і.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]