Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3726.doc
Скачиваний:
65
Добавлен:
13.11.2022
Размер:
6.15 Mб
Скачать

6.5. Устройства автоматического ввода аудио информации

Аудио – система ЭВМ состоит из : звуковой платы, акустической системы(динамики), микрофон, сигнальный процессор (DSP).

Состав звуковой карты:

  1. ЦАП/АЦП

  2. Си

  3. нтезатор

  4. Разъемы

  • линейный вход

  • линейный выход

Рисунок 6.34 - Работа звуковой платы на прием информации

Исходная форма звукового сигнала - непрерывное изменение амплитуды во времени - представляется в цифровой форме с помощью перекрестной дискретизации по времени и по уровню. Одновременно с временной дискретизацией выполняется амплитудная - измерение мгновенных значений амплитуды и их представление в виде числовых величин. Полученный поток чисел (серии двоичных чисел) называют импульсно-кодовой модуляцией – PCM.

fmax=

Рисунок 6.35 –Звуковой сигнал

Рисунок 6.36 – Устройство звуковой карты

Line in, Mic in - линейный и микрофонный входы

Aux: сигнал с этого входа минует все устройства и сразу идет на выход.

CD in используется для CD-ROM.

У всех разъем mini-Jack

На задней панели платы есть 15-пиновый разъем midi/джойстик порта, используется для подключения синтезаторов, клавиатур или джойстика.

Все сигналы с внешних аудиоустройств поступают во входной микшер, он служит для усиления.

АЦП - аналогово-цифровой преобразователь. Замеряет амплитуду поступающего сигнала и кодирует соотношения.

ЦАП - цифро-аналоговый преобразователь. Заменяет коды, преобразует в аналоговый сигнал.

DSP-сигнальный процессор управляет обменом данных со всеми остальными устройствами компьютера через шину ISA или PCI

Синтезатор - имитация музыкальных инструментов.

FM (Frequency Modulation - частотная модуляция) синтезатор для сохранения совместимости с Sound Blaster.

Wave Table-синтезатор для получения качественного звука.

RAM - оперативная память используется для загрузки звука

ROM - постоянная память, в ней хранятся образцы звучания

Рисунок 6.37 - Ввод аудио – информации

Речь имеет следующие составляющие:

  1. Фонема – базовый звук.

В разных языках количество звуков разное, например, в руссом – 44, в английском – 40.

  1. Аллофон – варианты фонемы.

Аллофонов может быть сотни, т.к. один и тот же звук разными людьми может быть произнесен по-разному.

  1. Дифтонг – промежуточный звук между фонемами.

  2. Слог.

Их может быть сотни или тысячи.

  1. Слова.

Их десятки тысяч.

  1. Словосочетание.

Одни и те же слова в разных словосочетаниях произносятся по-разному.

Формирование речевых сообщений и вывод речи:

Способы:

  • формирование по образцам (компилятивный синтез)

  • синтез по правилам

Описание речевого сигнала:

  • импульсно-кодовая модуляция (ИКМ) и ее разновидность – дельта – модуляция;

  • кодирование с линейным предсказанием (ЛПК);

  • частотная модуляция и параметрическое кодирование (ПАРКОР)

На основе ИКМ можно предложить схему, где от ЭВМ подается идентификатор сообщения (ИС), который включает базовый адрес, номер или ключ в словарь сообщения.

Рисунок 6.38 - Импульсно-кодовая модуляция

Обозначения:

БУП – блок управления поиском

ПО – память описания сообщения (база данных сообщений)

У & Ф – усилитель и фильтр

Рисунок 6.39 – Структура системы речевого ввода

Существует 2 подхода к распознаванию звука (голоса): распознавание отдельных фраз, распознавание текста.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]