
- •5.2. Анализ временной сонограммы и спектра речевого сигнала.
- •Определение частоты основного тона
- •Вторая гормоника:
- •5.3. Анализ спектра речевого сигнала.
- •Спектр речевого сигнала.
- •Запишем звук при помощи другого микрофона, применим fft фильтр и сравним результаты.
- •5.4. Анализ спектра гласных звуков.
Московский Государственный Технический Университет имени Н.Э.Баумана
ЛАБОРАТОРНАЯ РАБОТА № 1
«Основные свойства слуха и акустические сигналы»
(по курсу «Акустика»)
Выполнили:
Гонебный А.И.
Дощечкин А.С.
Проверил:
Козлачков С.Б.
2011 г.
5.1. Анализ временной сонограммы и спектра акустического сигнала.
Акустический сигнал.
Сонограмма акустического сигнала.
Вибросигнал сотового телефона Nokia E72.
Частота основного тона: 171,8 Гц.
На сонограме мы видим сочетание 2 звуков. Частоты на которых наблюдаются гармоники:
Частота 1 гармоники, Гц |
171,8 |
Частота 2 гармоники, Гц |
1765 |
Частота 3 гармоники, Гц |
2640 |
Частота 4 гармоники, Гц |
3703 |
Спектр акустического сигнала.
Определение амплитудных характеристик акустического сигнала.
Mono
Minimum RMS Power: -40.88 dB
Maximum RMS Power: -4.24 dB
Average RMS Power: -16.82 dB
Total RMS Power: -12.51 dB
Actual Bit Depth: 16 Bits
Using RMS Window of 10 ms
Тип сигнала |
Акустический |
Максимальный уровень, дБ |
-4.24 |
Минимальный уровень, дБ |
-40.88 dB |
Средний уровень, дБ |
-16.82 dB |
Динамический диапазон, дБ |
24,06 |
Пик фактор, дБ |
12.58 |
Динамический диапазон:
D = Lmax – Lmin
Пик фактор:
P= Lmax – Lsred
5.2. Анализ временной сонограммы и спектра речевого сигнала.
Речевой сигнал.
Сонограмма речевого сигнала.
Фраза: «Звук – это распространяющиеся в упругих средах – газах, жидкостях и твёрдых телах – механические колебания, воспринимаемые органами слуха. Звук распространяется в виде переменного возмущения упругой среды, т.е. в виде звуковых волн. Пространство, в котором происходит распространение этих волн, - звуковое поле. Если источник возмущения известен, то пространство, в котором могут быть обнаружены звуковые колебания, создаваемые этим источником называется звуковым полем данного источника звука. Звуковые колебания в жидкой и газообразной средах – продольные, в твердых телах – поперечные и продольные. Направление распространения звуковой волны – звуковой луч.»
Длительность речевого сигнала составляет 36 секунд.
Гласный звук «Е» слышен в промежутке времени от 8.9 секунды до 9.018. Его длина равна 0.118 секунд.
Гласный звук «У» слышен в промежутке времени от 9.9 секунды до 10. Его длина равна 0.1 секунды.
Согласный звук «Р» слышен в промежутке времени от 7.7 секунды до 7.766. Его длина равна 0.066 секунды.
Согласный звук «Т» слышен в промежутке времени от 1.226 секунды до 1.3. Его длина равна 0.073 секунды.
Пауза можно услышать в промежутке времени от 7.037 секунды до 7.481 секунды. Длина паузы составляет 0.444 секунды.
Спектр речевого сигнала.
Определение амплитудных характеристик речевого сигнала.
Mono
Minimum RMS Power: -49.8 dB
Maximum RMS Power: -8.24 dB
Average RMS Power: -25.07 dB
Total RMS Power: -22.9 dB
Actual Bit Depth: 16 Bits
Тип сигнала |
Речевой |
Максимальный уровень, дБ |
-8.24 |
Минимальный уровень, дБ |
-49.8 |
Средний уровень, дБ |
-25.07 |
Динамический диапазон, дБ |
41.56 |
Пик-фактор, дБ |
16.83 |
Динамический диапазон:
D = Lmax – Lmin
Пик-фактор:
P = Lmax – Lср
Вывод:
Значения пик фактора и динамического диапазона отличается от теоретического. Это говорит о том, что фраза речевого сигнала произносилась нечетко либо негромко и уровень шумов при записи сигнала был большим.
Изменим частоту дискретизации речевого сигнала до 8000 Гц и посмотрим что произойдёт с амплитудными характеристиками речевого сигнала:
Mono
Minimum RMS Power: -40.05 dB
Maximum RMS Power: -4.89 dB
Average RMS Power: -17.39 dB
Total RMS Power: -15.79 dB
Actual Bit Depth: 16 Bits
Using RMS Window of 10 ms
Тип сигнала |
Речевой |
Максимальный уровень, дБ |
-4.89 |
Минимальный уровень, дБ |
-40.05 |
Средний уровень, дБ |
-17.39 |
Динамический диапазон, дБ |
35.16 |
Пик-фактор, дБ |
12.5 |
Динамический диапазон:
D = Lmax – Lmin
Пик-фактор:
P = Lmax – Lср
Вывод:
Значения пик фактора и динамического диапазона при частоте 8000 Гц отличается от речевого сигнала с частотой 22050 Гц, т.к. уровень выше 8000 Гц оказался информативным и в нём содержится часть энергии. Информативности сигнал не потерял.
Исследуем интервал времени от 9.52 секунд до 9.78: