
- •Введение
- •1. Основы восприятия аудиовизуальных программ
- •1.1 Ощущение. Общие свойства ощущений
- •1.2. Восприятие. Основные свойства восприятия
- •1.3. Восприятие как активная перцептивная деятельность. Внимание
- •1.4. Модель обработки информации при восприятии
- •2. Зрительная система. Зрительное восприятие
- •2.1. Физический раздражитель
- •2.2. Восприятие света. Строение глаза
- •2.3. Оптическая система глаза. Аккомодация. Зрачковый рефлекс
- •2.4. Глазодвигательная система. Движения глаз и их функции
- •2.5. Световоспринимающая система глаза
- •2.6. Обработка зрительного сигнала
- •2.7. Механизмы цветового зрения
- •2.8. Бинокулярное зрение. Пространственные признаки
- •2.9. Механизмы адаптации
- •2.10. Характеристики зрительной системы
- •2.11. Зрительное восприятие кино- и телевизионных изображений
- •3. Слуховая система. Слуховое восприятие
- •3.1. Физический стимул: частота, амплитуда, сложность, фаза звука
- •3.2. Слух и слуховая система
- •3.3. Механизмы звуковосприятия
- •3.4. Основные феномены слухового восприятия
- •3.5. Слуховое пространственное восприятие. Анализ аудиальной сцены
- •3.6. Восприятие музыки и речи
- •3.7. Оценка качества звука при воспроизведении аудиовизуальных программ
- •4. Зрительное и слуховое восприятие аудиовизуальных программ
- •4.1. Определение аудиовизуальной программы
- •4.2. Звуковые и зрительные планы
- •5. Субъективная оценка качества изображения
- •Контрольные вопросы
- •Заключение
- •Список литературы
3.2. Слух и слуховая система
Слух – уникальный источник жизненно важной информации о том, что происходит в непосредственной близости от нас, а слуховая система – одна из самых «бдительных» сенсорных систем. Можно отметить следующие функции слуха: 1) идентификация и интерпретация звуков. Понимание сложных звуков и музыки; 2) обратная связь при управление речью; 3) определение направления и расстояния до источника звука; 4) выделение регулярного звука из шума (при распознавании слуховых образов).
Слуховой образ может быть определен как психологическое представление звуковой сущности, которая демонстрирует некоторую когерентность в своем акустическом поведении. Мы структурируем акустический мир в терминах когерентных звуковых объектов, которые мы можем обнаружить, выделить, локализовать, и идентифицировать. Когерентность в данном случае – это согласованное протекание во времени нескольких колебательных или волновых процессов, когда разность фаз этих процессов остается постоянной во времени или меняется по строго определенному закону.
Принципы распознавания слуховых образов:
1) сегрегация – разделение на звуковые потоки, т.е. субъективное выделение определенной группы звуковых источников, например, при музыкальной полифонии слух может отслеживать развитие мелодии у отдельных инструментов;
2) подобие – звуки, похожие по тембру, группируются вместе и приписываются одному источнику, например, звуки речи с близкой высотой основного тона и похожим тембром определяются, как принадлежащие одному собеседнику;
3) непрерывность – слуховая система может интерполировать звук из единого потока через маскер, например, если в речевой или музыкальный поток вставить короткий отрезок шума, слуховая система может не заметить его, звуковой поток будет продолжать восприниматься как непрерывный;
4) «общая судьба» – звуки, которые стартуют и останавливаются, а также изменяются по амплитуде или частоте в определенных пределах синхронно, приписываются одному источнику. Таким образом, мозг производит группировку поступившей звуковой информации как последовательную («горизонтальную»), определяя распределение по времени звуковых компонент в рамках одного звукового потока, так и параллельную («вертикальную»), выделяя частотные компоненты, присутствующие и изменяющиеся одновременно. Память объединяет все эти процессы в результате слушания.
Слуховая система состоит из периферической части (наружное ухо, среднее ухо и внутреннее ухо) и высших отделов слуховой системы [17].
Наружное
ухо (см. рис. 3.2) состоит из ушной
раковины и слухового канала,
заканчивающегося тонкой мембраной,
называемой барабанной перепонкой.
Наружные уши и голова – это компоненты
внешней акустической антенны, которая
согласовывает барабанную перепонку с
внешним звуковым полем. Основные функции
наружных ушей – бинауральное
(пространственное) восприятие, локализация
звукового источника и усиление звуковой
энергии, особенно в области средних и
высоких частот. Слуховой канал представляет
собой изогнутую цилиндрическую трубку
длиной 22,5 мм, которая имеет первую
резонансную частоту порядка 2,6 кГц,
поэтому в этой области частот он
существенно усиливает звуковой сигнал,
и именно здесь находится область
максимальной чувствительности слуха.
Барабанная перепонка – тонкая,
полупрозрачная мембрана толщиной 74
мкм, имеет вид конуса, обращенного
острием в сторону среднего уха. На низких
частотах она движется как поршень, на
более высоких – на ней образуется
сложная сист
ем
а
узловых линий, что также имеет значение
для усиления звука.
Среднее ухо – заполненная воздухом полость, соединенная с носоглоткой евстахиевой трубой для выравнивания давления. При изменении атмосферного давления воздух может входить или выходить из среднего уха, поэтому барабанная перепонка не реагирует на медленные изменения статического давления – спуск-подъем и т.п. В среднем ухе находятся три маленькие слуховые косточки: молоточек, наковальня и стремечко. Молоточек прикреплен к барабанной перепонке одним концом, вторым он соприкасается с наковальней, которая при помощи маленькой связки соединена со стремечком. Основание стремечка соединено с овальным окном во внутреннее ухо.
Среднее ухо выполняет следующие функции: согласование импеданса воздушной среды с жидкой средой улитки внутреннего уха; защита от громких звуков (акустический рефлекс); усиление (рычаговый механизм), за счет которого звуковое давление, передаваемое во внутреннее ухо, усиливается почти на 38 дБ по сравнению с тем, которое попадает на барабанную перепонку.
Внутреннее ухо находится в лабиринте каналов в височной кости, и включает в себя орган равновесия (вестибулярный аппарат) и улитку.
Улитка (cochlea) играет основную роль в слуховом восприятии. Она представляет собой трубку переменного сечения, свернутую три раза подобно хвосту змеи. В развернутом состоянии она имеет длину 3,5 см. Внутри улитка имеет чрезвычайно сложную структуру (см. рис. 3.3). По всей длине она разделена двумя мембранами на три полости: вестибулярный канал, улитковый канал и барабанный канал. Сверху улитковый канал закрыт мембраной Рейсснера, снизу – базилярной мембраной. Все каналы заполнены жидкостью.
Вестибулярный и барабанный каналы соединены через отверстие у вершины улитки (геликотрему). В вестибулярном канале находится овальное окно, через которое стремечко передает колебания во внутреннее ухо, в барабанном – круглое окно, выходящее обратно в среднее ухо. Базилярная мембрана состоит из нескольких тысяч поперечных волокон: длина 32 мм, ширина у овального окна – 0,05 мм (этот конец узкий, легкий и жесткий), у геликотремы – 0,5 мм (этот конец толще и мягче). На внутренней стороне базилярной мембраны находится орган Корти, а в нем – специализированные слуховые рецепторы – волосковые клетки. В поперечном направлении орган Корти состоит из одного ряда внутренних волосковых клеток и трех рядов наружных волосковых клеток. Между ними образуется кортиев тоннель. Волокна слухового нерва пересекают тоннель и контактируют с волосковыми клетками.
Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходящих от верхушки улитки, а наружные слои – от нижних ее участков. Войдя в ствол мозга, нейроны взаимодействуют с клетками различных уровней, поднимаясь к коре и перекрещиваясь по пути так, что слуховая информация от левого уха поступает в основном в правое полушарие, где происходит главным образом обработка эмоциональной информации, а от правого уха в левое полушарие, где в основном обрабатывается смысловая информация. В коре основные зоны слуха находятся в височной области, между обоими полушариями имеется постоянное взаимодействие.
Базилярная мембрана имеет частотноспецифичную (тонотопическую) организацию: ее верхушка вблизи геликотремы преобразует в нервные импульсы преимущественно низкочастотные сигналы, а основание (вблизи стремени) – более высокочастотные. Функционально тонотопическая организация означает, что определенная зона слуховой коры избирательно реагирует на определенные частоты.
Общий механизм передачи звука упрощенно может быть представлен следующим образом: звуковые волны проходят звуковой канал и возбуждают колебания барабанной перепонки. Эти колебания через систему косточек среднего уха передаются овальному окну, которое толкает жидкость в верхнем отделе улитки (вестибулярном канале), в нем возникает импульс давления, который заставляет жидкость переливаться из верхней половины в нижнюю через геликотрему и оказывает давление на перепонку круглого окна, вызывая при этом его смещение в сторону, противоположную движению стремечка. Движение жидкости вызывает колебания базилярной мембраны (бегущая волна). Преобразование механических колебаний мембраны в дискретные электрические импульсы нервных волокон происходят в органе Корти. Когда базилярная мембрана вибрирует, реснички на волосковых клетках изгибаются, смещаясь в сторону тектонической мемраны, и это генерирует электрический потенциал, что вызывает поток электрических нервных импульсов, несущих всю необходимую информацию о поступившем звуковом сигнале в мозг для дальнейшей переработки и реагирования.
Высшие отделы слуховой системы (включая слуховые зоны коры), можно рассматривать как логический процессор, который выделяет (декодирует) полезные звуковые сигналы на фоне шумов, группирует их по определенным признакам, сравнивает с имеющимися в памяти образами, определяет их информационную ценность и принимает решение об ответных действиях. Высшие отделы слуховой системы организованы: 1) тонотопически (вспомним ретинотопическую организацию зрительной коры, см. раздел 2.6), и 2) контрлатерально – большая часть нервных волокон от каждого уха (около 60%) оказывается в противоположном полушарии мозга. Правое полушарие «специализируется» на интегративной обработке пространственной информации и невербальных звуков (музыки), а левое – на аналитической обработке взаимосвязанных аудиальных стимулов (например, при восприятии речи и стимуляции, связанной с языком).