Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Руководство к лаб.работам_ver3f.doc
Скачиваний:
182
Добавлен:
14.03.2016
Размер:
5.56 Mб
Скачать
      1. Воспроизведение звуковых сигналов

Воспроизведение звуков в системе MatLab осуществляется с помощью следующих функций:

1) sound (y, Fs, bits);

% функция воспроизведения вектора (2-х столбчатой матрицы) с частотой дискретизации Fs (Fs =8192Гц, по умолчанию) и числом бит на отсчет bits (bits =16, по умолчанию)

2) soundsc (y, Fs, bits, s_lim); % sc-sound scaled

s_lim=[s_low, s_high]

% диапазон значений для преобразования к интервалу: -1…

3) wavplay (y, Fs, ‘mode’);

где параметр mode может принимать следующие значения:

а) sync - функция возвращает управление интерпретатору MatLab, после окончания звука

б) async - функция возвращает управление интерпретатору MatLab, не дожидаясь окончания звука.

Примечание 1: по умолчанию Fs=11025 , mode=async

Примечание 2: в async – режиме можно работать в системе MatLab, не дожидаясь окончания звучания звука.

      1. Запись звуковых сигналов

Запись звуков в системе MatLab осуществляется с помощью следующей функции:

y=wavrecord(n, Fs, ch, ‘dtype’);

где n – число записываемых отсчетов,

Fs – частота дискретизации,

ch – число каналов записи,

dtype – тип записываемых данных:

1) double – 16-битовая запись, -1…1, 8-байтовый формат с плавающей точкой,

2) single – 16-битовая запись, -1…1, 4-байтовый формат с плавающей точкой,

3) int16 – 16-битовая запись, -32768…32767, 2-байтовый формат целочисленный,

4) uint – 8-битовая запись, 0…255, 1-байтовый формат целочисленный, (0=128).

Примечание: по умолчанию запись осуществляется со следующими параметрами: Fs=11025, ch=1, ‘dtype’=‘double’.

  1. Лабораторная работа №1. Исследование внутренней структуры речевого сигнала

Цель работы: анализ фонетической структуры слов русской речи.

    1. Методические указания к лабораторной работе

В данной лабораторной работе студенту предлагается произвести фонетический анализ структуры речевого сигнала с помощью ее ручной сегментации. Работа выполняется на программе «Sound». Описание программы приведено ниже.

Результаты исследований оформляются в редакторе «Word» с использованием программ «ACDSee», «Photoshop».

Исходные фонограммы индивидуальны для каждого студента, для идентификации работы предлагается использовать фонограммы собственных фамилий или порядковые номера студентов по списку, возможно предоставление фонограммы преподавателем.

(Примечание: необходимо использовать фонограммы с частотой временной дискретизации 22050 Гц и разрядностью аналого-цифрового преобразования 16 разрядов).

    1. Исследование структуры и временных характеристик речевых сигналов

Исследования и оформление результатов проводятся с использованием программ «Sound», «ACDSee», «Photoshop».

      1. Ручная сегментация исследуемой фонограммы

Разделить исследуемую фонограмму на временные сегменты:

  • вокализованные (В-сегменты),

  • взрывные сегменты (Вз-сегменты),

  • шумовые сегменты (Ш-сегменты),

  • паузы (П-сегменты).

Для разделения фонограммы необходимо использовать программу «Sound».

Примеры разделения фонограммы на сегменты разных типов приведены на рис.2.1. и 2.2. Вокализованные сегменты разбиваются на кортежи кластеров (группы ОТ-кластеров со «схожими» характеристиками). ОТ-кластер соответствует длительности одного элементарного импульса возбуждения голосового аппарата.

В данном пункте исследований необходимо произвести анализ временных характеристик речевых сигналов, оценить ряд их временных и амплитудных параметров. Для этого по осциллограмме нужно определить и зафиксировать в отчете:

  • максимальное число уровней квантования, соответствующее каждому временному сегменту,

  • рассчитать число «активных» двоичных разрядов, требуемых для представления соответствующих временных сегментов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]