Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УЛА

.pdf
Скачиваний:
30
Добавлен:
21.03.2016
Размер:
2.29 Mб
Скачать

главное: Речевой сигнал возникает в результате воздействия одного или нескольких источников звука на систему резонаторов, образуемых воздушными полостями речевого тракта.

Роль движений речевых органов – создать в речевом тракте аэродинамические условия, необходимые для образования звуковых колебаний (речевой тракт ~ акустическая труба)

Для создания звучания 2 условия: 1) создать поток воздуха = механизм продувания воздуха через речевой тракт; 2) раздробить этот поток и превратить в колеблющуюся воздушную струю = на поток должно быть наложено акустическое возмущение (модуляция)

Дыхательная система – инициатор звуковых колебаний; создаёт движущийся поток воздуха – внешний источник акустической энергии. Голосовые связки и артикуляторы – источники звука.

Воздушный столб речевого тракта имеет собственные частоты колебаний. Колебания от источника проходят через реч.тракт ­> нек­е частотные составляющие (те, у кот­х частоты близки к частотам тракта) усиливаются, другие либо без изменений, либо подавляются. => речевой тракт – резонатор

Резонансные (aka частотные, избирательные, фильтрующие) характеристики речевого тракта – его передаточная (фильтровая) функция

Акустическая теория речеобразования = модель источник­фильтр Источники звука в речи. Есть 3 типа: голосовой, турбулентный и импульсный.

Голосовой источник

Голосовые связки – наиболее мощный источник звука; закрывают/открывают проход воздуха через голосовую щель ­> импульсы ­> звуковая волна. Последовательность воздушных толчков

(импульсов) – глоттальная волна = голос

Голос – сложный периодический звук, может быть представлен в виду суммы простых синусоидальных колебаний – гармоник.

Первая гармоника голосового спектра – основной тон. Его частота ­ F0 (основная частота). Частоты остальных гармоник (обертонов) – в целое число раз её больше. Чем больше F0, тем выше голос.

Частота голоса, с которой человеку привычно и удобно говорить – базовая частота. Она обычно в нижней трети голосового диапазона. Для мужчин – 130 Гц, для женщин – 260 Гц

Турбулентный источник

Турбулентный шум возникает, когда в воздушном потоке в речевом тракте появляется турбулентность, обусловленная вихрями.

Два условия для возникновения: 1) на пути потока должно быть сужение (щель); 2) позади сужения должно быть избыточное давление

Это выполняется при произнесении фрикативных

Импульсный источник

Звуковой импульс = взрыв – скачкообразное изменение давления воздуха

Создать избыточное давление, полностью перекрыв выход воздуха на достаточно длительный интервал времени (не менее 30 мс)

Для взрывных согласных

Форманты ­ резонансные максимумы передаточной функции. Инчае: форманты ­ собственные частоты резонаторов, наиболее усиленные в спектральной картине звука.

На основании однородности спектральных ( и слуховых) характеристик выделяют следующие участки:

стационарный участок – участок с устойчивыми, мало изменяющимися спектрльными характеристикми (тот отрезок звучания гласного, на котором частота f1 f2 не изменяется и они ближе всего к той частоте, которая имеется у изолированного гласного)

переходный участок: от конца предшествующего согласного(или гласного) до начала стационарного участка гласного, и от конца стационарного участка гласного до начала следующего согласного (или гласного)

Задача акустической теории речеобразования состоит в том, чтобы выявить и количественно описать аэродинамические и акустические процессы, которые происходят в речевом тракте при артикуляции. Понимание этих процессов создает возможность обратных заключений: от акустики к артикуляционной картине, которые также очень важны. Знание акустики речеобразования необходимо и для правильной интерпретации физических данных, так как оно позволяет отделить ожидаемые, прогнозируемые артикуляцией акустические свойства речевого сигнала от неожиданных, непрогнозируемых, а это, в свою очередь, заставляет ставить вопрос о причинах таких акустических неожиданностей. Ими могут быть какие­то неучтенные или даже неизвестные исследователям особенности артикуляции либо какие­то случайные факторы. Для фонетической науки важно, что акустическая теория речеобразования придает интерпретации физических речевых данных объяснительный, научный характер.

Основы акустической теории речи были заложены в XIX в. немецким физиком Г. Гельмгольцем. В XX в. наибольшую известность в этой области знания получили работы Г. Фанта и Дж. Фланагана. Книга Фанта "Акустическая теория речеобразования" признана классическим трудом по акустике речи.

Основные положения

Роль движений речевых органов – создать в речевом тракте аэродинамические условия, необходимые для образования звуковых колебаний (речевой тракт ~ акустическая труба)

Для создания звучания 2 условия: 1) создать поток воздуха = механизм продувания воздуха через речевой тракт; 2) раздробить этот поток и превратить в колеблющуюся воздушную струю = на поток должно быть наложено акустическое возмущение (модуляция)

Дыхательная система – инициатор звуковых колебаний; создаёт движущийся поток воздуха – внешний источник акустической энергии. Голосовые связки и артикуляторы – источники звука.

Воздушный столб речевого тракта имеет собственные частоты колебаний. Колебания от источника проходят через реч.тракт ­> нек­е частотные составляющие (те, у кот­х частоты близки к частотам тракта) усиливаются, другие либо без изменений, либо подавляются. => речевой тракт – резонатор

Резонансные (aka частотные, избирательные, фильтрующие) характеристики речевого тракта – его передаточная (фильтровая) функция

Главное положение: Речевой сигнал возникает в результате воздействия одного или нескольких источников звука на систему резонаторов, образуемых воздушными полостями речевого тракта.

P(f)=S(f)*T(f)

S(f) – амплитудно­частотный спектр колебаний, создаваемых источником звука T(f) – передаточная функция резонаторной системы

P(f) – амплитудно­частотный спектр результирующих звуковых колебаний

[я хз надо это или нет ʘ ʘ ]

Впереводе на русский: частотная фильтрация состоит в том, что амплитуда каждой из частотных составляющих источника звука умножается на значение передаточной функции тракта на той же частоте.

Т.к. произнесение звуков – процесс динамический и характеристики меняются во времени, в формулу также добавляется параметр времени (во все скобочки рядом с f).

Акустическая теория речеобразования = модель источник­фильтр

ЧТО НА КАРТИНКЕ: колебания при производстве гласных. (А) – источник создает толчки воздуха. (Б) – амплитуды гармоник спектра толчков (В) – проходят через тракт, (Г) – умножаются на значения передаточной ф­ии, у которой 2 выраженные резонансные частоты (я не понимат, почему две? L). (Д) – получаем сложный периодический сигнал. В них усилены те составляющие, кот­е близки к максимумам передаточной ф­ии (Е).

ДОПУЩЕНИЕ для всей теории: акустические свойства источников звука и резонаторной системы тракта относительно независимы.

Ряд волнообразных колебаний равной длительности – это тон. Непериодические колебания создают шумы.

ИСТОЧНИКИ ЗВУКА В РЕЧИ Три типа: голосовой, турбулентный и импульсный

Голосовой источник

Голосовые связки – наиболее мощный источник звука; закрывают/открывают проход воздуха через голосовую щель ­> импульсы ­> звуковая волна. Последовательность воздушных толчков (импульсов) – глоттальная волна = голос

Голос – сложный периодический звук, может быть представлен в виду суммы простых синусоидальных колебаний –

гармоник.

Первая гармоника голосового спектра – основной тон. Его частота ­ F0 (основная частота). Частоты остальных гармоник (обертонов) – в целое число раз её больше. Чем больше F0, тем выше голос.

Частота голоса, с которой человеку привычно и удобно говорить – базовая частота. Она обычно в нижней трети голосового диапазона. Для мужчин – 130 Гц, для женщин – 260 Гц

Турбулентный источник

Турбулентный шум возникает, когда в воздушном потоке в речевом тракте появляется турбулентность, обусловленная

вихрями.

Два условия для возникновения: 1) на пути потока должно быть сужение (щель); 2) позади сужения должно быть избыточное давление

Это выполняется при произнесении фрикативных

Импульсный источник

Звуковой импульс = взрыв – скачкообразное изменение давления воздуха

Создать избыточное давление, полностью перекрыв выход воздуха на достаточно длительный интервал времени (не менее 30 мс)

Для взрывных согласных

тип источника

класс звуков, им порождаемый

 

 

голосовой

гласные, сонанты

 

 

турбулентный

глухие фрикат. согл. (РЯ:щелевые: фхшс)

 

 

импульсный

глухие взрывные согл. (РЯ:чистые смычные: птк)

 

 

импульс+турбул.

глухие взрывные согл./аффрикаты + t’

 

 

голос+турбул.

звонкие фрикат. согл.

 

 

голос+импульс

звонкие взрывные согл.

 

 

голос+импульс+турбул.

звонкие взрывные согл./аффрикаты + d’

 

 

Форманты – резонансные максимумы передаточной функции. Для образования и различения звуков речи существенны две (в некоторых случаях три или четыре) первые, наиболее низкие по частоте. (форманты нумеруются по частоте, Ф1 – ниже, 2 – выше и тд).

F1 – первое после частоты основного тона усиление в спектре. Для закрытых гласных и ы у граница между F0 и F1 хрен различшь, так как они близки. У более открытых гласных частота повышается. Максимальная для а.

F2 имеет самое высокое значение для переднего гласного и и самое низкое для заднего у.

Среди всех гласных гласный ы имеет следующую особенность: при произнесении ы начальное значение частоты F2 ниже конечного.

Изолированное произнесение гласных явление редкое. Обычно гласные произносятся в сочетании с согласными или другими гласными. И F1 F2 изменяются под влиянием качества соседнего согласного (в первую очередь под влиянием места образования). Частота F1 на границе с согласным всегда ниже, чем на остальном участке гласного. Частота F2 может быть выше и ниже в зависимости от места образования согласного и от качества гласного. F2 сильнее всего изменяется под влиянием предшествующего мягкого согласного: в этих случаях на границе между согласным и гласным f2 имеет более высокую частоту, чем на стационарном участке гласного.

На основании однородности спектральных ( и слуховых) характеристик выделяют следующие участки:

стационарный участок – тот отрезок звучания гласного, на котором частота f1 f2 не изменяется и они ближе всего к той частоте, которая имеется у изолированного гласного.

переходный участок: от конца предшествующего согласного(или гласного) до начала стационарного участка гласного, и от конца стационарного участка гласного до начала следующего согласного (или гласного)

Акустические характеристики гласных определяются свойствами надгортанных полостей, играющих роль резонаторов. Резонансные частоты каждой из полостей зависят от объема и формы полости, т. е. от положения языка, губ и т. д. Эти резонансные частоты принято называть формантами гласных. При описании акустических свойств гласных учитывают, как правило, свойства первых двух формант (FI и FII), относительно которых известно, что их частота определённым образом связана с артикуляционными свойствами гласных: частота FI зависит от подъема гласного (чем более открытый гласный, тем выше частота FI), а FII — от ряда гласного (чем более передний гласный, тем выше частота FII); огублённость понижает частоту обеих формант, назализованность приводит к ослаблению интенсивности FI и FII в к появлению дополнительной «форманты назализованности». Предполагается, что для гласных с высокой частотой FII (т. е. для гласных переднего ряда) существенны и характеристики более высокой форманты, FIII. Изменения частотных характеристик формант во времени свидетельствуют об артикуляторных изменениях гласного.

Акустическая классификация гласных основывается как на собственно частотных характеристиках формант, так и на более сложных признаках, описывающих расположение формант в спектре гласных. В соответствии с тем, в какой части спектра — высокой или низкой — сосредоточена основная энергия, гласные делятся на высокие и низкие; с точки зрения расположения формант по отношению к центральной части спектра гласные делятся на компактные (в спектре которых форманты занимают центральную часть) и диффузные (форманты расположены по краям спектра); по степени удаления расположения формант от положения формант нейтрального гласного гласные делят на напряжённые (большее расстояние) и ненапряжённые (меньшее расстояние).

Наиболее неясным вопросом речевой коммуникации на настоящий момент остается вопрос о способе временной организации речевого сигнала, распадающийся на два составляющих:

­реализуется ли реально линейный формат в речевом сигнале (аналогично тому, как это делается в письменной речи для фонетически ориентированный видов письменности).

­где в речевом акустическом сигнале сосредоточена основная смысловая, поведенчески полезная информация.

Про временную организацию. Мол в разных позициях разная длительность, в сильной позиции этой длительности хватит для реализации всей программы. Будут и переход и стационарный участок. А для слабой позиции мб только переход, и нет

стационарного участка. Ну и еще это накладывается верхними уровнями, ударением и интонацией, они сильно влияют на позицию и следовательно длительность.

12. Акустические признаки речевых сигналов. Методы исследования акустических свойств речевого высказывания. Соотношение акустических и психоакустических свойств звуков речи.

И артикуляторные, и акустические хар­ки важны. Но акустические хар­ки возникают в тот момент, когда артикуляторные уже сработали.

Речевой сигнал – реакция резонансной системы речевого тракта на возбуждение его источниками звуковых колебаний. Звуковая волна – результат воздействия генератора звука на фильтрующую систему речевого тракта. Определяется хар­ми как источника звука, так и фильтрующей системы.

Периодичность – основное свойство голосового источника.

Звук речи, как и всякий другой звук, является результатом воздействия на слуховой аппарат человека колебательных движений воздушной среды. При описании звуков их рассматривают как бы с двух сторон: 1) изучают объективные свойства колебательных движений – частоту, силу, спектральный состав; 2) звуковые ощущения, которые так или иначе соответствуют этим свойствам – высоту, громкость, тембр. Существует специальная область акустики, занимающаяся исследованием закономерностей восприятия звуков – психоакустика.

Частота и высота

Гц = колебание/с Диапазон речевых частот – от 50 до 10000 Гц. Больше частота – более высокие звуки, но

зависимость не линейная (довольно сложная). Единица высоты звука – мел. Человек с нормальным слухом слышит звуки частотой от 16 до 20 тыс Гц.

Сила и громкость

Сила звука определяется амплитудой колебательного движения. Звуковые колебания можно представить как последовательные сгущения и разрежения воздуха, т.е. изменение воздушного давления. Звуковое давление измеряется силой, действующей на единицу площади.

Критическое значение звукового давления, ниже которого звук перестает слышаться, ­ порог слышимости. При увеличении давления возрастает громкость, пока не переходит в ощущение боли, ­

это порог болевого ощущения.

Вакустике для измерения используют логарифмические единицы – децибелы. Для тона 1000 Гц уровень силы звука, соответствующего порогу слышимости, 0 дБ, а уровень, соответствующий порогу болевого ощущения – 130 дБ.

Вакустике громкость звука любой частоты измеряется значением уровня звукового давления равногромкого звука частотой 1000 Гц. Эта величина называется уровнем громкости.

Спектр звука и тембр

Чаще всего встречаемся со сложными звуками. Если приведем струну в колебания, то самый низкий тон, который она может издавать – основной тон. Также образуется и звук, более высокий по частоте; могут быть колебания с частотой, в кратное число раз выше основного тона ­> образуются обертоны.

Чтобы охарактеризовать сложный звук акустически, нужно получить представление о его основном тоне, частоте гармоник (обертонов) основного тона и об относительной интенсивности всех его частотных составляющих. Эти данные получаем при спектральном анализе.

Спектр влияет на восприятие тембра. Тембр – субъективная окраска, независимая от громкости и высоты.

Методы исследования акустических св­в речевого высказывания

Осциллографическая запись (=осциллограмма) – график, который показывает, как изменяется амплитуда звукового давления во времени при произнесении речевого отрезка. В докомпьютерную эпоху использовались осциллографы, их записи – аналоговые, потому что они – непрерывная фиксация электрического аналога речевого сигнала. Сейчас осциллограммы получают на компах.

По осциллограмме можно установить принадлежность тех или иных фрагментов сигнала к основным классам (т.е. можем, например, отличить гласные/сонорные от шумных и тд). Недостаток: трудно/невозможно определить акустические хар­ки, которыми звуки одного класса (с одним и тем же источником) отличаются друг от друга.

Звуки речи на осциллограмме Гласные. Представляют собой периодические колебания, вызванные действиями голосовых связок

и осложненные формантными частотами. На осц.кривой гласные – последовательность более или менее одинаковых по рисунку участков, соответствующих периоду основного тона. Из русских гласных наиболее сложный рисунок – у «а».

Так выглядят осциллограммы:

Сонанты похожи на гласные Звонкие щелевые – рисунок, содержащий колебания основного тона, осложненные высокими

частотами шума согласных. Если шум слабый, то рисунок может приближаться к рисунку сонантов. Взрывные звонкие – рис., состоящий из двух частей, соответствующих разным фазам артикуляции:

во время звонкой смычки – основной тон, в конце звучания и момент взрыва – высокие составляющие. Глухие щелевые – в отличие от звонких, нет периода основного тона, обладают более сильным

шумом.

Глухие смычные – не имеют периода основного тона и имеют неоднородный рисунок. Аффрикаты имеют неоднородный рисунок.

Спектральное представление

Спектрограмма – графическое изображение спектра звуковых колебаний. Получить спектр какого­либо звука – значит измерить совокупность значений амплитуд всех частотных составляющих, образующих данный звук.

Основной принцип – использование фильтров, которые требуют предварительного преобразования звукового колебания в электрическое. Фильтры играют роль резонаторов.Звук, преобразованный в электрические колебания, попадает на систему фильтров, у каждого фильтра своя частота. Из всего набора фильтров на звук будет «откликаться» только те, частота кот­х близка к звуку. Весь диапазон частот, существенных для звука, можно разбить на определенное число шагов, каждый из которых представлен одним фильтром.

Кроме анализа с помощью фильтров (параллельный анализ), используют и анализ последовательный. Звук записывается на магнитный диск или ленту, склеивается в кольцо, повторяется много раз и используется один фильтр, перестраивающийся по частоте.

Мгновенные спектры дают представление о том, какие именно частоты и в какой степени усилены в данном звуке, не отражают изменения во времени.

Динамические спектрографы – для анализа временных изменений звуков.

При описании спектральных хар­к звуков речи приходится вводить широкий разброс значений почти для всех хар­к из­за индивидуальных особенностей произношения. Также изменение собственных спектральных хар­к звуков происходит из­за того, что фонетическое положение данного звука влияет на его образование в конкретном случае. Спектральные хар­ки существенны, но не исчерпывают всех особенностей звуковых единиц.

Спектрограммы звуков речи

Гласные. Отличия друг от друга можно описывать на основании F1 и F2. На основании однородности спектральных хар­к в гласном принято выделять: стационарный участок звучания (где частота F1 и F2 не меняется и где форманты макс близки к формантам изолированно произнесенной гласной), переходные участки: первый – от конца предыдущего согласного (или гласного в случае сочетания 2 гласных) до начала стационарного, второй – от конца стационарного до начала следующего согласного (гласного).

Согласные. Сонанты – наиболее близки к гласным.

При образовании глухих взрывных согл действует импульсный шумовой источник, составляющие спектра распределены почти по всей полосе частот, длительность взрыва очень мала.

Звонкие взрывные. 2 источника – шумовой и голосовой. Во время смычки – низкочастотные составляющие в области частоты основного тона4 в момент взрыва – шумовые составляющие в широкой полосе частот.

Глухие щелевые. Турбулентный шумовой источник, более определенные частотные области. Звонкие щелевые отличаются появлением низкочастотных составляющих и ослаблением шумовых составляющих.

Аффрикаты. Глухая смычка (реализуется как пауза), щелевая фаза (реализуется как высокочастотный шум).

ПЕРЦЕПЦИЯ (13­15)

13. Основные теории восприятия речи

необх. помнить, что звуковое восприятие всегда служит более общей цели ­ опознаванию слов, из которых состоит сообщение, плюс установлению смысловых связей; перцептивный акт ­ часть общего процесса распознавания языковой структуры сообщения, стадия выделения языковых ключей звуковой природы для дальнейшего опознавания

! при построении модели восприятия делаются следующие допущения:

звуковая сторона языковых знаком в памяти представлена фонемной цепочкой (т.е. имеется инвентарь, дифф. признаки как важная часть знания), и сигнал преобразуется в последовательность фонемных единиц

учитывается частичное опознавание вследствие явлений артикуляционной редукции, неопределённостей контекста, помех…

учитываются акустические средства коартикуляции ­ значительное варьирование акустических характеристик фонем

Существует 3 класса гипотез о перцепции, объясняющих механизм фонемной интерпретации: I. артикуляционного источника ­ моторные теории

II. перцептивного эталона (с опорой на наличие идеального представления каждого звука в сознании носителя)

III. признаков гипотезы (с опорой на дифф. признаки) собственно теории: (NB: на экзамене надо рассказать любые две)

1. моторная теория восприятия (с опорой на артикуляц. источник), далее стала неомоторной, пережила ряд изменений… сейчас не очень популярна

­предполагается, что разные механизмы отвечают за восприятие речевых и нерешенных сигналов: при восприятии речи релевантны и фиксируются только те акустические признаки, которые связаны с артикуляторными

­паузы ­ нерешенные механизмы; возможно восприятие одновр. речевых/неречевых признаков => речевые сигналы могут обрабатываться на фоне помех

­на основе выделенных акустических признаков слушающий восстанавливает целевые артикуляционные жесты, реализация которых приводит к появлению звука с наблюдаемыми акустическими характеристиками

­целевые жесты рассматриваются как элементы глубинных артикуляционных планов, не зависящих от контекста, имеющих связь с фонологическими признаками и являющихся общими, стандартными способами достижения акустических сигналов => артикуляционная реконструкция ­ результат внутреннего артикуляционного синтеза (мы

бессознательно проговариваем то, что слышим), в которой участвует система речепроизводства, тогда получается, что один и тот же модуль отвечает за артикуляцию/восприятие (кто­то считает, что посредством фонологических признаков)

­возможно, что такой модуль и существует (а в психолингвистике существует), но его необходимо вовремя развить (у детей)

в пользу: ребёнок проговаривает всё что думает, прежде чем интернализировать речь; ребёнок сперва учится произносить, а потом осознавать произнесённое и разницу; у афатиков якобы восприятие работает хуже, если “задета” артикуляция (не в моторной коре, а в Брока); явление колебаний голосовых связок, когда мы кого­то слушаем против: данные синхронного перевода (т.е. модуль по идее не должен выполнять

восприятие/говорение одновременно, но у переводчиков это получается) + при параличе артикуляции (моторно) восприятие вообще­то сохраняется, тогда напрямую артикуляция и восприятие связаны быть не могут применение: из­за неполноты не нашла широкого применения