Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основные корреляты слухового стимула.docx
Скачиваний:
6
Добавлен:
17.04.2019
Размер:
3.57 Mб
Скачать

Временные эффекты в области слуха

До сих пор мы имели дело главным образом со звуками достаточно большой длительности, полагая, что изменения последней не имеют большого значения. Теперь мы должны более подробно изучить данный вопрос с точки зрения временных характеристик в области слуха.

Интегрирование по времени. Акустическая энергия сама по себе не возбуждает слухового механизма. Для того чтобы вызвать определенный эффект, энергия должна расходоваться в течение некоторого отрезка времени. Поэтому мы можем ожидать, что процесс возбуждения должен быть связан с некоторым видом аккумуляции возбуждения. В этой связи возникает вопрос: каковы законы, управляющие этой аккумуляцией? Одним из основных методов, применяющихся при решении данного вопроса, является определение зависимости между длительностью звука и интенсивностью, которой он должен обладать для того, чтобы достигнуть абсолютного порога. Данный метод применялся Хью (1946), Гарнером (1947), Миллером (1948) и де Ври (1948).

На основании полученных ими результатов, частично показанных на фиг. 30, видно, что (в пределах изученного) с увеличением длительности звука порог уменьшается.

Фиг. 30. Интегрирование по времени у абсолютного порога. Кривые показывают уменьшение энергии порога по мере увеличения длительности акустического стимула.

Если бы мы подвергли рассмотрению только кривую в 4000 гц, (см фиг.30), можно было бы построить гипотезу в отношении того, что слуховой механизм просто интегрирует мощность стимула и что порог, выраженный в виде интеграла мощности по времени, то есть энергия, является постоянным:

It = const,

I - интенсивность, a t - длительность. Согласно данной гипотезе, все кривые должны пойти вниз так, что уменьшение интенсивности на одну логарифмическую единицу (10 дб) будет соответствовать увеличению длительности на одну логарифмическую единицу, а мы видим, что наклон кривой шума составляет около 8 дб на каждую логарифмическую единицу длительности. Вторая трудность заключается в том, что кривая для 250 гц выпрямляется, вместо того чтобы подниматься вверх налево по мере уменьшения длительности. И, наконец, как подсказывает здравый смысл, все кривые должны выпрямляться вместо спуска вниз направо, если мы делаем длительность стимула достаточно большой.

В силу сказанного мы должны изменить гипотезу простого интегрирования. Имеется бесконечно большое число возможных вариаций, две из которых рассматривались для порога маскировки Гарнером и Миллером (1947). Первую мы можем назвать гипотезой "входного исключения". Вкратце она заключается в том, что постоянная составляющая энергии стимула Iо исключается из процесса возбуждения и не интегрируется. Поэтому функция порога выражается следующим образом:

(I-Io)t = const.

Вторая вариация представляет собой слуховую аналогию статистической теории зрительной чувствительности Крознера (1940). Эта формулировка подводит, однако, к предположению, настолько близкому к упомянутому, что данные не позволяют провести между ними четкого разграничения. Как это часто бывает, обе гипотезы достаточно надежны, но ни одна из них не является безусловно правильной.

Фиг. 31. Разностный порог интенсивности как функция длительности добавленного приращения. DІ/І является отношением приращения звукового давления к нормальному звуковому давлению. Приращения длительностью 0,5 сек легко выявляются как более продолжительные, а более короткие по длительности требуют большей интенсивности. Светлыми и черными кружками обозначены результаты двух испытуемых (по Миллеру и Гарнеру, 1944).

До сих пор у нас нет еще ясного представления о разнице между кривой шума и кривой тона в 4000 гц. Можно только сказать, что процесс аккумуляции подвергается влиянию ширины полосы акустического сигнала. С другой стороны, своеобразное поведение кривой частоты 250 гц объяснимо. В то время когда длительность тона уменьшается, энергия распределяется по шкале частот. Некоторая часть данной энергии приходится на такой участок частот, в котором слуховая чувствительность будет значительно выше, чем она бывает при 250 гц. Данное обстоятельство повышает слышимость тона и делает кривую менее пологой при короткой длительности. От длительности зависит не только абсолютный порог, но и порог маскировки (Гарнер, 1947), а также разностные пороги тонов (Миллер и Гарнер, 1944). Зависимость между разностным порогом интенсивности и длительностью приращения, добавленного к постоянному тону, показана на фиг. 31. Разностный порог для частоты также становится больше, поскольку длительность приращения сокращается.

Повышение и понижение громкости. Когда мы воспринимаем на слух короткий звук, мы слышим, что громкость его быстро возрастает, достигает максимума и затем уменьшается. Проблема определения ощущения во времени интересовала нескольких исследователей (Мезгер, 1932; Рэлофс, 1939, Бутендейк и Мейстерс, 1942), но измерение громкости через небольшие промежутки времени оказалось очень затруднительным.

Тем не менее оказалось возможным ответить более точно на этот вопрос в терминах слухового стимула. Как следует изменять интенсивность тона, чтобы компенсировать изменения его длительности? Сколько должен длиться звук до того, как он приобретет максимальную громкость? Насколько медленно можно выключать звук и все-таки иметь резкое его завершение? Бекеши (1933), Лифшиц (1933) и Мансон (1947) изучали эти вопросы с тональными стимулами, а Миллер (1948), воспользовавшись однородным спектром белого шума, чтобы избежать проблемы "загрязненности" коротких тонов, исследовал эти вопросы на всплесках шума.

Бекеши обнаружил, что для обеспечения постоянства коротких тонов он должен заменить интенсивности I длительностью t согласно правилу log I = -k log t + c. Однако после того, как длительность тона с частотой 800 гц достигла 180 мсек, громкость более не возрастала. Используя тоны с частотой 125, 1000 и 5650 гц, Мансон добился величины критической длительности, составляющей 250 мсек.

Результаты, полученные Миллером (фиг. 32), показывают, что критическая длительность белого шума зависит до некоторой степени от интенсивности, но величина ее меньше, чем величина для звуков, по данным Бекеши и Мансона. Путем изучения ответных слуховых реакций двух испытуемых (с отсутствующими слуховыми косточками и мышцами, которыми обычно они прикреплены), Миллер имел возможность показать, что зависимость от интенсивности нельзя объяснить сокращением мышц среднего уха.

Фиг. 32. Кривые равной громкости для белого шума как функции длительности стимула. Звуковое давление коротких всплесков шума, каждый из которых равен по громкости стандартному всплеску (1,0 сек), изображено на графике как функция длительности короткого всплеска. Пунктирная кривая показывает самую короткую длительность, для которой громкость независима от продолжительности (по Миллеру, 1948).

Метод, применяемый для изучения снижения слуховой чувствительности, заключался в выключении звука или шума при варьируемой степени резкости этого выключения и определении наибольшей скорости снижения чувствительности, различимой от мгновенного прекращения. Результаты, полученные как Бекеши, так и Миллером, совпадают в оценке того, что длина отрезка времени, требуемая для исчезновения ощущения независимо от интенсивности звука, приблизительно постоянна. Шум исчезает в продолжение половины того периода времени, который требуется для исчезновения тона. Один путь объяснения исчезновения ощущения, как интенсивного, так и слабого, - это допустить, что отдельные элементы слуховой системы работают параллельно, а не последовательно. Поэтому, исключая разницу между латентным периодом и скоростью проводимости, для начала возбуждения всех элементов или прекращения его после начала потребуется не больше времени, чем для активизации или прекращения возбуждения одного элемента.

Причины того, почему шум исчезает быстрее тона, не совсем ясны, но, вероятно, это объясняется тем, что шум возбуждает в основном всю слуховую систему, в то время как тон - только часть ее. Когда тон выключается, возбуждение идет на убыль в той части системы, которая была возбуждена, но следы его могут в течение некоторого времени оставаться.

Разумно предположить, что эти следы выступают на фоне нейтрального возбуждения, то есть в состоянии покоя невозбужденной ткани. Когда шум выключается, то исчезает и фон, с которым контрастируют следы.

С вопросом увеличения и исчезновения слуховой чувствительности тесно связан вопрос громкости коротких импульсов. Этот вопрос изучался Штейделем (1933), который определял (по данным опроса испытуемых) громкость щелчков (потрескивание), вызываемых электрическими импульсами различной формы и величины и подаваемых с выхода репродуктора.

Фиг. 33. Отношение между уровнем громкости понижающегося по экспоненте импульса и его постоянной времени. Уровень громкости определяется как уровень чувствительности в децибелах над порогом тона с частотой 1000гц, имеющего такую же громкость (из Стивенса и Дэвиса, 1938; по данным Штейделя, 1933).

Результаты Штейделя показаны на фиг. 33. Постоянная времени импульса Т представляет собой отрезок времени, соответствующий уменьшению амплитуды по экспоненте до величины, равной 1/е (около 37%) от своей первоначальной амплитуды.

Фиг. 34. Отношение между уровнем громкости повышающегося по экспоненте импульса и его постоянной времени (отрезок времени, требуемый для того, чтобы амплитуда импульса достигла приблизительно 63% своего конечного значения). По мере того как постоянная времени увеличивается более 0,3 мсек, импульс увеличивается незначительно, поскольку медленно повышающийся импульс (большая постоянная времени) имеет наибольшую концентрацию энергии при очень низких частотах, к которым слуховой механизм является нечувствительным (из Стивенса и Дэвиса, 1938; по данным Бюрка, Котовского и Лихте, 1935).

Штейдель расценивал полученные им результаты как показатель того, что существенной частью щелчка (или треска) являются первые 0,3 сек и что громкость щелчка пропорциональна интегралу давления для всего временного интервала. Бюрк, Котовский и Лихте (1935) определяли спектр щелчков Штейделя и нашли, что можно полагаться на его результаты так же, как и на результаты, полученные при исследовании щелчков других форм (фиг. 34), учитывая распределение энергии стимула скорее по частоте, чем во времени. Позже Гарнер (1947а) использовал этот подход для объяснения явления слышимости и громкости прерываемых тонов. Таким образом, до сих пор не было успешных попыток регулировать громкость как функцию одновременно частоты и времени. Высота звука коротких тонов. Поскольку длительность синусоидального тона увеличивается от 2-3 мсек до 0,5 сек и больше, можно вычленить три стадии его субъективно воспринимаемого качества. Эти стадии описаны Бюрком, Котовским и Лихте (1935), а также Доути и Гарнером (1947) так: I стадия - испытуемый слышит только треск; II стадия - звук, похожий на щелчок (треск) с характерным тональным свойством, и III стадия, в которой различимы треск при включении и треск при выключении тональной части с установившейся высотой звука в промежутках.

Фиг. 35. Изображение коротких сегментов синусоидальной звуковой волны в координатах интенсивность - частота - время. Данные изображения соответствуют тому, что было показано на фиг. 4. Визуальное представление об изображении полностью аналогично слуховому впечатлению, полученному при прослушивании трех стимулов.

Чтобы уяснить характер стимулов на этих трех стадиях, следует подумать о коротком тоне в терминах соотношения интенсивность - частота - время.

Из изображения, представленного схематически на фиг. 35, видно, что концентрация энергии по частоте, несомненно, зависит от длительности синусоидального сегмента. В верхних двух диаграммах энергия распределяется по шкале частот настолько рассеянно, что для слуховой системы нет основания судить о высоте звука. В средней диаграмме, однако, имеется очень заметная концентрация энергии на частоте 3000 гц. В нижней диаграмме концентрация почти такая же четкая, как и для чистого тона. При оценке стимула с этой точки зрения мы видим, что все указанное полностью соответствует тому, что слышит испытуемый.

Доути и Гарнер определили величину самой короткой длительности, при которой испытуемый может заметить "высоту треска", и наибольшую длительность, при которой испытуемый слышит "высоту тона". Пороги длительности, определенные при умеренно высокой интенсивности, показаны на фиг. 36. При более низких интенсивностях порогов величина длительности будет несколько больше.

Фиг. 36. Пороги длительности для двух степеней "высоты" как функции частоты. На частоте ниже 1000 гц необходимо услышать два или три периода волны, чтобы определить преобладающую высоту звука, в то время как на частотах свыше 1000 гц порог представляет собой не фиксированное число периодов, а фиксированную продолженность во времени (по Доути и Гарнеру, 1947).

Монауральное детектирование фазовых различий. Ответственность за утверждение того, что испытуемый "не может воспринять фазу", часто приписывают Гельмгольцу. Действительно, в своей работе "Ощущение тона" Гельмогольц писал, что "качество музыкальности сложного тона зависит полностью от количества и относительной силы его парциальных простых тонов, а ни в коем случае не от их фазовых различий". Но Гельмгольц говорит также и следующее: "Мы не смогли охватить в своих экспериментах немузыкальные тона с их верхними парциальными тонами по шкале частот, следовательно, остается пока не выясненным, являются ли важными для этих диссонансных тонов фазовые различия. Последующее теоретическое рассмотрение, возможно, и позволит ответить на данный вопрос положительно". Это небольшое замечание из приведенного (последнего) утверждения было высказано пионерами в области изучения слуха, за исключением Кёнига. При ошибочной ссылке на авторитет Гельмгольца теория "фазовой глухоты" была полностью принята (см. Боринг, 1942).

Насколько безосновательной оказалась данная теория, видно из того факта, что фазовые различия представляют собой просто временные различия. Когда мы сдвигаем фазы отдельных компонентов сложной волны, они либо опережают, либо отстают по времени. В настоящее время на основании повседневного опыта мы видим, что слуховая система способна регистрировать эти временные различия и, следовательно, не является полностью "фазово-глухой". Для окончательного доказательства мы можем снова рассмотреть белый шум и единичный импульс на фиг. 1. Оба звука имеют "плоский" спектр. Единственная разница наблюдается в одной из фаз: компоненты белого шума различной частоты образуют свои фазовые углы беспорядочно, в то время как все частотные компоненты единичного импульса достигают своей максимальной амплитуды при времени а=0, перекрывая друг друга во всякое иное время. В результате мы слышим белый шум как звук "шшш...", а единичный импульс как "пт".

Мэйтес и Миллер (1947) изучали большое разнообразие стимулов специально для выделения фазовых эффектов при монауральном восприятии. В одном из экспериментов они использовали стимул типа, показанного на фиг. 37. В каждой паре изображенных контуров заметная разница в форме колебаний объясняется полностью различиями в фазе; амплитудно-частотное изображение идентично. Тем не менее имелись заметные различия в ощущениях, вызванных стимулами. Колебание, характеризуемое более широкими флуктуациями огибающей, звучало резко. При прослушивании второго колебания испытуемые заметили отчетливое уменьшение резкости. Они также сообщали, что "очевидное ощущение высоты звука" заметно улучшилось.

Фиг. 37. Возбуждения, используемые для мензурального различения фазовых изменений. Оба члена каждой пары колебаний имеют одинаковые амплитудно-частотные характеристики. Каждое колебание состоит из трех компонентов, 1000 - f, 1000 и 1000 + f, где f определяется как "сигнальная частота". Единственное различие между членами каждой пары заключается в том, что один компонент (1000 колебаний) имеет один фазовый угол, а в другом угол сдвинут на 90°. Этот фазовый сдвиг произведет очевидное различие субъективного звука. Верхние звуки грубее и ниже по высоте, чем нижние (по Мейтесу и Миллеру, 1947).

Мэйтес и Миллер обнаружили несколько других пар образцов стимулов, отличавшихся только по фазе, но вполне различимых на слух. Для монауральных фазовых эффектов необходимы три условия: первое - важные компоненты стимула должны быть близки по частоте (как думал Гельм-Гольц), второе - не должно быть слишком большого числа компонентов и третье - фазовые изменения должны отчетливо сказаться на форме огибающей колебания.