Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метод указ.к лр..doc
Скачиваний:
7
Добавлен:
24.12.2018
Размер:
3.27 Mб
Скачать

5. Содержание отчета

В отчет необходимо включить: 1) изложение цели работы; 2) схему установки; 3) таблицы измеренных и вычисленных величин; 4) виды временных зависимостей и спектров для всех режимов; 5) выводы по разделам измерений и результатам прослушивания.

6. Контрольные вопросы

1. В чем состоит принцип имитации речевого сигнала при акустическом моделировании?

2. Какую роль при прослушивании в помещениях звука играют первые отражения?

3. Перечислите основные причины использования в помещениях отражающих козырьков.

4. Какие основные преимущества при звукопередаче имеет амплитудно-модулированный сигнал?

5. При какой скважности видеоимпульсов в модулируемых радиоимпульсах наиболее заметны тональные составляющие?

Литература

1. Анерт В., Стеффен Ф. Техника звукоусиления. Теория и практика. - М.: «ПКФ Леруша», 2003.

2. Давыдов В.В. Акустика помещений. Текст лекций. – СПб.: Изд. СПбГУКиТ, 1995.

3. Акустика: Учебник для вузов / Ш.Я. Вахитов и др. Под ред. проф. Ю.А. Ковалгина. - М.: Горячая линия – Телеком, 2009.

4. Стандарт USA. ANSI.S.3.2 – 1999.

5. Щиржецкий Х.А. О возможности использования импульсных откликов полосовых фильтров при акустических измерениях: Сб. трудов НИИСФ. – М.: 1981. – С. 22-29.

Работа № 3 Исследование качества звукопередачи в помещениях

1. Цель работы: ознакомление с методиками субъективной и объективной оценки качества звукопередачи речи (музыки) в гулком помещении.

2. Общие сведения

Качество звукопередачи в помещении определяется рядом объективных и субъективных критериев. К числу последних следует, прежде всего, отнести понятность речи, которая оценивается соответствующим количественным критерием –­ разборчивостью S. Под этим термином чаще всего понимают слоговую разборчивость, которая определяется отношением правильно понятых слогов к общему числу произнесённых, выраженную в процентах[1]:

Sсл = mпп / mпр • 100 %, (3.1)

где mпп – число правильно понятых слогов; mпр – число произнесённых слогов.

Слог представляет собой характерную совокупность фонем (звуковых единиц), обладающую вполне определёнными параметрами и информативностью в результате последовательного сочетания процесса нарастания амплитуды звука, затем некоторого промежутка времени существования её и, наконец, затухания амплитуды. Здесь согласные и гласные звуки неразрывно связаны друг с другом, но гласные звуки, формируемые импульсом воздуха голосовой щели, более продолжительны по времени, обладают большим давлением и могут самостоятельно формировать слоги. Для русской речи гласные звуки под ударением имеют в среднем длительность около 0,2 с, а неударные – 0,1 с, с амплитудой давления на близких расстояниях (8...10см) ото рта до 0,1 Па[2].

Согласные же звуки, образуемые шумами при продувании воздуха в полости рта, имеют меньшую продолжительность и амплитуду давления, участвуя в слоге только в сочетании с гласными звуками. Длительность согласных изменяется в диапазоне от 0,02 до 0,15 с при среднем значении около 0,1 с. Их амплитуды также изменяются в более широких пределах со средним значением порядка 0,01 Па, определяя тем самым динамический диапазон речевых сигналов.

Таким образом, если представить речевой сигнал в виде амплитудно- или частотно-модулированных тональных импульсов, то влияние помещения будет проявляться в изменениях временных, частотных, амплитудных и даже пространственных характеристик первичного сигнала. Особенно заметно это сказывается на временных зависимостях, когда изменяется продолжительность процессов нарастания и затухания амплитуд. Причём в начальные промежутки времени, особенно заметные на слух, в суммарном сигнале будут учитываться, кроме энергетических, когерентные интерференционные добавки за счёт ранних отражений, а в стадии, близкой к установившейся только энергетические составляющие за счёт отражений с большим запаздыванием. Следовательно, информация, передаваемая импульсным сигналом с малой скважностью, будет значительно искажена.

Степень влияния отражений на первичный сигнал характеризуется так называемым предельным временем запаздывания (ПВЗ), вызывающим ощущение эха между сигналом и его запаздывающим повторением. За пороговое значение ПВЗ для речевых сигналов принимается промежуток времени, не достигающий 40 мс. Здесь наблюдается качественное “слияние” сигнала и его повторения: не заметны на слух временной разрыв между ними и изменение тембра. При интервалах в пределах от 40 ... 60 и даже 85 мс замечается изменение тембра реверберационного характера. Однако при разнице в их уровнях порядка 10 дБ изменение тембра не воспринимается. Для интервалов запаздывания примерно 80 ... 85 мс наблюдается отрыв последующего звука от предыдущего, приходящего к слушателю в одном направлении, т.е. эхо. При этом разборчивость с увеличением интервала запаздывания непрерывно падает, достигая наименьшего значения ≈ 80% при запаздывании около 200 мс для ораторской речи с нормальным темпом и 350 мс для замедленной повествовательной речи.

Однако для интервалов времени, больших 200...350мс, разборчивость вновь увеличивается. Этот факт свидетельствует о том, что малозапаздывающие отражения, имеющие наибольшую корреляционную (мультипликативную) связь с сигналом, оказывают наибольшее влияние на разборчивость. А отражения с большим временем запаздывания, которые приобретают ненаправленный диффузный характер, в меньшей степени влияют на разборчивость речи и воспринимаются на слух как некоторая аддитивная помеха, характеризующая больше помещение, чем источник сигнала.

Следует отметить, что именно слоговая разборчивость является одним из немногих субъективных критериев качества передачи речи в помещениях, который получил вполне хорошее объективное подтверждение [3]. Так, в зависимости от архитектурно–акустических данных разборчивость находится из соотношения:

Sсл(%) = 96 Kнч · Kвч · KN · KТ. (3.2)

Здесь коэффициент 96 учитывает предельное восприятие в идеальных условиях. Коэффициенты Kнч и Kвч, соответственно, учитывают имеющееся или необходимое ограничение полосы частот на низких и высоких частотах в тракте звукопередачи. Коэффициент KN зависит от соотношения сигнал/шум в помещении, а KТ по импульсной реакции выражает зависимость разборчивости от ранних отражений и времени реверберации. Зависимость коэффициентов в (3.2) от соответствующих факторов, определённая опытным путём, показана на рис. 3.1 … 3.3.

Существенное значение для временных параметров речи имеет частота следования модулированных импульсов (слогов), или темп речи, влияние которого на разборчивость любой речи в помещениях рассматривалось в своё время В.А. Кнудсеном.

Рис.3.1 Рис.3.2 Рис.3.3

Действительно, общий темп речи, определяемый отношением числа лингвистических единиц (слов, слогов), содержащихся в сообщении, ко времени высказывания, для русской речи колеблется от 120 до 400 слогов в минуту (2...7сл/с) при среднем значении порядка 290 слогов в минуту (5сл/c). Установлено, что оптимальным является режим, когда темп предъявления речевой информации равен собственному темпу речи слушающего на родном языке. При медленном темпе усложняется синтетическое обобщение впечатлений, а быстрый темп мешает аналитическому рассмотрению речевого потока.

Семантические и эстетические характеристики речи, а также качество любых музыкальных звуков оценивается с помощью значительного количества различных критериев, среди которых можно выделить основные: чёткость, прозрачность, пространственное впечатление и др.

Перечисленные критерии являются энергетическими, поскольку определяются соотношением энергий начального и завершающего участков реверберационного процесса помещения. Каждый из критериев может быть определён количественно с помощью соответствующих коэффициентов или индексов, выраженных в децибелах [3]. Так например, индекс чёткости, характеризующий качество звукопередачи речи

; (3.3)

индекс прозрачности, характеризующий качество передачи музыки

; (3.4)

индекс пространственного впечатления, характеризующий гулкость помещения

’ (3.5)

где T60 – время стандартной реверберации помещения; r0=rг /r – нормированный, по заданному расстоянию r, радиус гулкости; po – значение звукового давления в данной точке помещения, измеренное микрофоном с круговой характеристикой направленности; pп – значение звукового давления в данной точке, измеренное направленным микрофоном.

В последнее время для исследования субъективных характеристик звука в помещении часто используют установку “искусственная голова” (ИГ), с помощью которой можно смоделировать бинауральный приём

звуковых сигналов и установить более точно закономерности такого приёма. Поскольку последние основываются на субъективном различении прямого и отражённого звуков, при измерениях необходимо учитывать направление прихода звука. Экспериментально установлено, что боковые отражения вносят наибольший вклад в формирование слухового восприятия, поэтому данный метод предполагает измерять степень взаимной корреляции сигналов на ушах искусственной головы. Приведённые формулы для определения качества звукопередачи в помещении предполагают измерения мгновенных величин звуковых давлений, что требует достаточно сложной аппаратуры.

Однако, если использовать гулкое помещение (например, ревербера-ционную камеру), можно применить статистическое приближение (полагая, что переходные процессы подчиняются экспоненциальной зависимости) и численные значения коэффициентов (и индексов) качества звука можно определить расчётным путём с помощью таких характеристик помещения, как время стандартной реверберации T60 и радиус гулкости rг. Значения T60 и rг , соответственно, рассчитываются по формулам:

T60 = 0.164 V / αS , (3.6)

где V – объём гулкого помещения; А=αS – суммарное поглощение всех поверхностей помещения,

, (3.7)

где Ф – фактор направленности громкоговорителя; Ωт – телесный угол излучения громкоговорителя.

Определив T60 и rг, можно рассчитать значения С50, С80 и R по приближенным формулам (3.3)…(3.5).

В настоящей работе предлагается провести артикуляционные измерения разборчивости речи по давлению (через коммутируемые от микрофонов ИГ головные телефоны) и в диффузном поле реверберационной камеры при изменении положения слушателей.