Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Речевая характеристика

.doc
Скачиваний:
71
Добавлен:
21.01.2014
Размер:
251.68 Кб
Скачать
  1. Учебник!! Посмотри ! http://yurpsy.by.ru/biblio/leont/leont.htm

2. Не непонятно

http://www.vspu.ru/~axiology/vik/status12.htm

3. Статья http://www.philol.msu.ru/rus/gorn/arso/zlat2.htm

Л.В. Златоустова, Е.И. Галяшина

Распознавание индивидуальных и групповых акустико-перцептивных характеристик говорящего по звучащей речи

Предпосылки распознавания речевых характеристик говорящего.

В прикладных исследованиях звучащей речи с целью оценки релевантных для распознавания по речи индивидуальных и групповых свойств личности говорящего до настоящего времени основной проблемой все еще остается разработка надежных методик идентификации и диагностики говорящего.

Для криминалистических приложений исследований звучащей речи актуальны задачи установления личности говорящего человека по звукозаписям звучащей речи. В последнее время стало очевидно, что "узнаваемости" голоса в бытовом понимании для надежного и достоверного отождествления личности не достаточно. Существует довольно большая вероятность фальсификации, подделки звукозаписи, когда вместо голоса одного человека на ней может быть зафиксирована звучащая речь совершенно другого лица с похожими голосовыми качествами.

Непременным условием для распознавания говорящего по звучащей речи является наличие сравнительных образов или эталонных записей голоса и речи. При этом успех распознавания во многом зависит от степени сопоставимости сравниваемых речевых объектов.

Однако, часто лицо, чей голос оказывается зафиксированным на пленке неизвестно, его необходимо разыскать. Поэтому для ограничения и сужения круга проверяемых лиц осуществляется групповая идентификация на основе диагностического психолингвистического исследования записанного устного текста. Первая задача, встающая перед экспертами - это определение категориальных свойств личности говорящего (образования, сферы профессиональных интересов, регионального диалекта и т.д.), чтобы в дальнейшем, когда будет определен круг подозреваемых лиц, можно было бы получить их сравнительные образцы голоса и речи для дальнейшей идентификации или верификации говорящего.

Здесь необходимо сделать небольшое отступление. Дело в том, что специфика прикладных речевых исследований применительно к задачам криминалистики в отличие от других во многом обусловлена методологией криминалистики и судебной экспертизы, что во многом определяет степень сложности речевого исследования.

Криминалистическая идентификация (лат. - identifico, отождествляю) это процесс (и одновременно метод и цель познания) установления тождества объекта или личности по совокупности общих и частных признаков. Современная теория идентификации, как известно, базируется на принципе индивидуальности объектов, их относительной неизменности, на возможности выделения их характеризующих общих и частных признаков. Совокупность этих признаков позволяет осуществить идентификацию объекта.

В отличие от идентификации криминалистическая диагностика - это частный метод познания, позволяющий получить представление о механизме преступного действия на основе его отражения в объектах материального мира. Диагностика устанавливает фактическое обстоятельство на основе самих материальных объектов, их следов, иных отображений, сопутствующих совершению преступления, путем исследования свойств объекта, отображений объекта, соотношений фактов и т.д., то есть устанавливает все виды связей между объектами. Теоретическая основа диагностики - принципиальная возможность познания событий, явлений объектов по их отражениям.

В связи с вышеназванными причинами применительно к прикладным исследованиям звучащей речи, связанным с распознаванием речи и диагностикой голоса, приоритетным становится установление корреляции параметров речевого сигнала и классификационными характеристиками говорящего (его принадлежность к различным возрастным, социальным, профессиональным и диалектным группам) по отраженным в его речевом сигнале языковым признакам.

Трудности диагностического и идентификационного исследования речевых особенностей говорящего заключаются в том, что эксперту приходится работать с большим многообразием речевых реализаций, обусловленных экстралингвистическими факторами. До настоящего времени нет, сколько-нибудь приемлемых по надежности и достоверности автоматических систем речевого распознавания на материале русского языка. В условиях реальной криминалистической практики добиться 100% правильной текстонезависимой идентификации говорящего, используя самый современный математический аппарат пока не удается.

Используются два подхода к решению проблемы распознавания говорящего по речевому сигналу - текстонезависимый и текстозависимый. Текстонезависимая идентификация основана на алгоритмическом анализе речевого сигнала и математических методах его параметрического описания.

Не вдаваясь в детали можно констатировать, что эффективность подобных автоматических систем крайне низка, так как не существует универсальных параметров описывающих речь, устойчивых к шумам и искажениям, к имитации и сознательной маскировки говорящим. Кроме того, вариативность речевого сигнала в пределах языковой системы достаточно высока, зависима от многих взаимосвязанных факторов, не всегда поддающихся формализованному описанию.

То есть трудности в создании автоматических речевых систем во многом связаны со сложностью и специфичностью самого исследуемого объекта - звучащей речи. Но задачи распознавания бывают абсолютно разной сложности, от минимальной - сепарации голосов по дифференциальным признакам, верификации говорящих на конечном множестве при наличии известных эталонов, до максимальной - идентификации на открытом множестве в неограниченном пространстве детерминирующих факторов.

Для того, чтобы на практике получить достоверное решение о тождестве или различии говорящих по фонограммам их речи можно применять различный подход, позволяющий сузить круг рассматриваемых факторов и снизить сложность задачи. Это возможно в тех случаях, когда известно, что круг идентифицируемых лиц ограничен. Например, необходимо атрибутировать по принадлежности говорящим реплики в полилоге в условиях маскировки речевого сигналами различными помехами и шумами. В подобной задаче решение о дифференциации реплик по принадлежности участникам разговора достигается за счет выделения одной-двух классификационных особенностей, манифестирующих о принадлежности говорящего к различным социумам или диалектным группам.

Допустим, известно, что множество говорящих, чья речь записана на фонограмме конечно. Речь одного участника разговора нормативна, в речи другого проявляются остаточные диалектные явления южно-великорусского происхождения, а речь третьего (при полном соответствии лексической и грамматической норме) характеризуется специфичной тембральной просторечной окраской. Наличие подобных классификационных особенностей позволяет дифференцировать говорящих и атрибутировать реплики с одноименными характеристиками по принадлежности.

Актуальная проблема прикладных исследований звучащей речи возможность дифференциации признаков, которые манифестируют о принадлежности устного текста к конкретному функциональному стилю, от тех, что указывают на принадлежность говорящего к неким социальным или региональным группам носителей русского языка, а также сугубо индивидуальных речевых предпочтений, речевых привычек, навыков и умений говорящего. Здесь звучащая речь - выступает одновременно как объект собственно акустического, лингвистического, социо- и психо-диагностического и идентификационного исследования. Вычленение признаков, характеризующих функциональный стиль речи, группу людей или конкретного индивида - предмет отдельного прикладного направления исследования звучащей речи.

В то же время языковые, социальные, территориально-диалектные, психо-физиологические и индивидуальные особенности говорящего присущи каждой языковой личности и в той или иной степени проявляются в каждом речевом акте, что обуславливает возможность их выявления и классификации.

Для того, чтобы решить задачу распознавания говорящего по речи из звучащего речевого потока вычленяются параметры, которые являются отражением индивидуальных свойств говорящего.

Надо отметить, что на исследование обычно представляют две или более записей звучащей речи. Одна запись - это, так называемая спорная фонограмма голоса и речи неизвестного (устанавливаемого) лица. Такая запись фигурирует в качестве вещественного доказательства. Чтобы подтвердить принадлежность записи звучащей речи конкретному подозреваемому лицу, у него отбираются сравнительные образцы. Эти образцы выступают в качестве идентифицирующего объекта. Образцы звучащей речи подозреваемого лица для сравнительного исследования должны обладать свойством несомненности происхождения от конкретного объекта, а также характеризоваться сопоставимыми лингвистическими и экстралингвистическими признаками, позволяющими проводить сравнение с идентифицируемыми объектами.

При отборе сравнительных образцов часто повторяются типичные ошибки, затрудняющие или делающие идентификацию говорящего невозможной. Следователи обычно предлагают прочитать публицистический (газетный, журнальный) или художественный письменный текст в то время как на спорной фонограмме записана спонтанная или квазиспонтанная речь говорящего.

Для успешного решения задачи идентификации сравниваемые речевые реализации должны быть близки. При отождествлении говорящего производится попарное сравнение двух или более человек по звучащей речи, то есть опосредованно через их акустическое и слуховое представление в виде двух векторов параметров, выделенных из сравниваемых фрагментов звучащего текста. Тогда как при диагностике проводится сравнение и классификация выделенного вектора речевых параметров с некими абстрактными знаниями о группе или классе людей, объединенных по данному признаку, например, территориальному диалекту. В обоих случаях в процессе исследования звучащей речи выявляются комплексы признаков, которые классифицируются и ранжируются по виду их происхождения, указывающего на принадлежность к группе или классу людей. Индивидуально-конкретное тождество говорящего на открытом множестве может быть установлено в том случае, когда совокупность выделенных признаков неповторима, то есть искомая группа оказывается равна индивиду. Групповая идентификация ограничивает круг людей, обладающих общими речевыми особенностями.

Таким образом, распознавание индивида или группы лиц, объединенных по одному или иному признаку, по комплексу речевых параметров обусловлено рядом объективных лингвистических и экстралингвистических факторов.

В ходе решения реальных экспертных задач на практике приходится иметь дело с теми спорными фонограммами, которые представлены на исследование, независимо от того в каких ситуациях и обстоятельствах они записаны. Для обеспечения максимальной сопоставимости и обеспечения достоверной индивидуально-конкретной или групповой идентификации необходимо, чтобы сравнительные образцы звучащей речи, как уже сказано, были сопоставимы со спорной фонограммой по форме представления речевого материала. Подчеркнем, что крайне нежелательно представление звукозаписи в виде чтения для сравнения со спонтанной речевой реализацией.

Система просодических единиц является общей для всех видов функциональных стилей звучащей речи (включая слоги, ритмические структуры фонетических слов, синтагмы и их ритмические модели, фразы, фоноабзацы), но их распределение, частотность и вероятность встречаемости специфичны для разных функциональных стилей звучащей речи (Златоустова Л.В., 1993 г.).

Дело в том, что комбинаторика лексических и грамматических единиц разных функциональных стилей во многом определяет выбор единиц просодического уровня. Так, например, говорящий читает текст в совершенно иной манере, чем он спонтанно говорит, использует разные синтаксические, лексические и просодические модели при пересказе или озвучивании письменного текста.

Механизм процесс порождения звучащей речи и речевая стратегия говорящего меняется (иногда очень существенно) в зависимости от функционального стиля речи, специфические характеристики которого преимущественно зависят от ситуации, целевой установки и коммуникативного намерения даже в рамках реализации одного текста. В то же время в пределах одной ситуации с изменением коммуникативного задания и мотивации можно встретить неоднородность речевых стратегий и способов их выражения в разных функциональных стилях.

В реальной практике чаще всего в качестве так называемого спорного речевого материала представляют звукозаписи спонтанных устных текстов, а в качестве сравнительных образцов звукозаписи допросов у следователя в форме кратких или развернутых ответов на заранее сформулированные письменные вопросы или в виде чтения письменного текста.

Поэтому для того, чтобы получить достоверные результаты сравнительного исследования речевых реализаций, требуется определить языковые средства, экстралингвистические условия и коммуникативную установку говорящего, которые формируют разные виды функциональных стилей.

Квалификация функциональных стилей звучащего текста.

Прежде всего, рассмотрим факторы конституиирущие функциональные стили русской звучащей речи. Необходимо отметить, что эта проблема до сих пор не имеет однозначной трактовки среди лингвистов. Требует дополнительного рассмотрения проблема квалификации спонтанности/подготовленности реплик-ответов говорящего, отвечающего на вопросы следователя в процессе допроса. Функциональный стиль ответа, доведенного до автоматизма на близкую и знакомую тему, можно определить как квазиспонтанный стиль с учетом возможного обдумывания. При определенной ситуации, целевой установке и мотивации в случае неожидаемого вопроса речь допрашиваемого можно квалифицировать как спонтанную. Понятно, что специфическое оформление спонтанной речи на фонетическом, семантико-синтаксическом и лексико-семантическом по полярным признакам отличает спонтанную речь от чтения письменного текста. Эти различия существенны для решения прикладных задач распознавания диктора.

Очевидно, что для того, чтобы отличить специфические характеристики оформления различных функциональных стилей от индивидуальной стилистической манеры реализации звучащей речи конкретным индивидом необходимо разграничить разновидности функциональных стилей по квалификационным признакам.

Для оценки и выявления квалификационных признаков спонтанных текстов речи различной тематики был проведен анализ звукозаписей, представлявшихся авторам на экспертизы по уголовным и гражданским делам. При этом звукозаписи содержали монологические и диалогические тексты на тему рассказа о различных событиях и обстоятельствах, в том числе связанных с фактами совершения различных преступлений, беседы на деловые темы, обсуждения различных бытовых проблем, доклады и выступления на совещаниях, отчеты о проделанной работе или состоянии дел в различных организациях и формированиях, указания, наставления и приказы, а также развернутые мотивированные жалобы, просьбы и заявления, чтение протоколов допросов, чистосердечные признания, показания на допросах в судебном заседании, при проведении следственных действий в ходе предварительного расследования (показания на месте происшествия, на очной ставке и т.д.).

По характеру выражаемых эмоций звукозаписи содержали тексты, с нейтральной, эмоционально-возбужденной и эмоционально-подавленной окраской.

Анализ всего массива звучащих текстов (около 80 часов звучания фонограмм устного текста) показал, что образованные носители русского языка, обладающие высокой языковой компетенцией, сохраняя собственные индивидуальные речевые предпочтения, навыки и умения, проявляют общие черты, свойственные определенному стилю речи. При этом диалектные и просторечные сферы речевой коммуникации маркировались в силу специфики самой речевой реализации.

Таким образом, оказалось возможным, выделить квалификационные признаки функциональных и сопоставить их с типологией форм звучащих текстов исходя из анализа и способов их формирования и реализации (Златоустова Л.В., 1993г.). В результате удалось квалифицировать тексты по следующим категориям:

1. Чтение написанного и обдуманного текста (монолог, диалог и полилог)

1.1. Чтение "своего" письменного текста.

1.2. Чтение "чужого" письменного текста.

2. Пересказ написанного или прочитанного письменного текста.

2.1. Пересказ "своего" письменного текста.

2.2. Пересказ "чужого" письменного текста.

2.3. Воспроизведение суфлированной речи.

3. Подготовленный текст, но не сформированный в виде полного письменного текста, написанный в виде набросков, тезисов или плана (например, лекция, доклад, выступление, отчет).

4. Квазиспонтанный, подготовленный (обдуманный), но не написанный текст (например, ответы при допросе у следователя или в суде, ответы на экзамене, выступление на митинге, на совещании).

5. Спонтанный (неподготовленный текст).

Как видно, основными признаками, различающими указанные виды текстов, является признак наличие/отсутствие письменного аналога, признак "свой"/"чужой", для чтения и пересказа, признак "подготовленности"/"неподготовленности" звучащего текста. Указанные звучащие тексты различаются также просодическими способами выражения модальных и эмоциональных значений.

Надо отметить, что в основе дифференциации функциональных стилей и их рубрикации положена коммуникативная установка говорящего, включая лингвистические и экстралингвистические факторы.

То есть можно выделить четыре формы реализации звучащего текста:1) озвучивание письменного текста, в виде чтения или воспроизведения по памяти, 2) устное изложение подготовленного текста, 3) порождение квазиспонтанного звучащего текста и 4) продуцирование спонтанного устного текста.

Порождение устного текста в виде изложения подготовленного текста, порождения квазиспонтанного текста и особенно продуцирование спонтанной звучащей речи принципиально отличается от чтения или воспроизведения письменного текста по памяти спецификой просодического и грамматического оформления.

При этом сравнительный анализ звучащих текстов различных функциональных стилей показал, что для задачи распознавания индивидуальных и групповых свойств личности наиболее представительными и репрезентативными оказывается спонтанно порожденные устные тексты, так как в них наиболее полно и системно проявляются речевые навыки и привычки говорящего, а также признаки, которые остаются за пределами сознательного контроля при речепроизводстве, так называемые остаточные диалектные или иноязычные проявления.

Более того, спонтанный текст в максимальной степени содержит признаки психо-физиологических свойств речевых особенностей человека. Особенно показатели кратковременной и долговременной памяти, потребностно-мотивационные условия реализации речи. Спонтанность как дифференциальный признак проявляется в просодическом и мелодическом оформлении звучащего текста. Особенности спонтанности речи увеличиваются в условиях ограничения времени на подготовку или обдумывание (одновременное обдумывание и порождение) в рамках кратковременной памяти, объем которой обусловлен индивидуальными психофизиологическими свойствами личности.

Этим фактором детерминируется универсальная специфика просодического и мелодического оформления фраз и фоноабзацев в виде нанизывания синтагм однотипного мелодического образования, синтагм, оканчивающихся ровным или небольшим подъемом движения (модели незавершенности или неконечного завершения). Другая универсальная характеристика спонтанной и квазиспонтанной речи - это наличие речевых сбоев и пауз-хезитаций (неуверенности, выбора лексемы или синтаксической модели). Надо отметить, что количество и качество пауз-хезитаций зависит от ряда условий (речевых навыков публичной речи, объем аудитории, сложность обсуждаемой тематики, степень знакомства говорящего с предметом речи и т.д.). Так, например, если человек средне владеет речевыми навыками, отмечается значительно большее число речевых сбоев, меньшее число осложненных синтаксических структур, сокращение типов придаточных конструкций (определительных и дополнительных). При этом снижается доля бессоюзных предложений с увеличением числа придаточных, с подчинительными союзами или союзными словами, но увеличивается число пауз-хезитаций, заполненных лексическими или звуковыми элементами. При высокой степени развития навыков публичной речи паузы имеют среднестатистическое время, типичное для рассматриваемых фрагментов.

Здесь надо отметить, что в рамках одного функционального стиля могут встречаться различные фонетические стили. Фонетический стиль по Щербе Л.В. (1974 г.) может быть полным или неполным (разговорным). В реальной звучащей речи полный стиль произнесения, отражающий "идеальный фонетический состав слова", практически не встречается, добавим - за редким исключением. Так, полный стиль произнесения может встретиться при скандировании, когда используются модальные конструкции, выражающие отношение говорящего, и целевую установку - фиксировать внимание слушающего на каком-то факте или действии. Подобные высказывания можно встретить при наличии мотивации воздействия на слушателя, например, в речи педагогов, учителей, воспитателей. Например, встречается утрированное, по слоговое произнесение модальных конструкций с растягиванием гласных в безударных слогах:

"Пов-то-ря-ю - этот прибор называется а-риф-мометр".

Другой пример - это декламация - публичное выступление политического деятеля перед телекамерами, когда каждая синтагма оказывается равна одному или двум фонетическим словам с ярко выраженным фразовым выделительным акцентом, принуждая слушающего осмысливать каждое сказанное слово.

Например,

"Не так - сели - пересядьте"

Такая манера речи свойственна, например, литургической проповеди с установкой воздействия на слушателей. При этом отмечается аналогичная структура синтагм в одно или два фонетических слова. Здесь нужно сказать, что подобная манера речи говорящего, доведенная до автоматизма, проявляется и в неожидаемых ситуациях, например, даже при допросе у следователя, что является одним из критериев степени выраженности индивидуальных признаков речи.

Однако во всех разновидностях функционального стиля звучащая речь имеет неоднородности с точки зрения соотношения полного и неполного произносительного стиля.

Так, спонтанная речь обладает большей долей неполного стиля произнесения, чем чтение. В спонтанной речи у говорящего в наибольшей степени проявляются излюбленные речевые модели. Тогда как при чтении большое влияние на реализацию единиц сегментного и суперсегментного уровней оказывает графика, техника чтения, знакомство говорящего с текстом, качество зрения, освещенность и другие экстралингвистические факторы.

В разных коммуникативных ситуациях на форму реализации звучащего текста влияет значительное число экстралингвистических моментов, таких как отношения между говорящим и слушающим, наличие фактора ограничения по времени, внешняя обстановка и т.д. Владея инвентарем лексем и синтаксических конструкций говорящий в спонтанной форме речи способен порождать неограниченное число речевых высказываний, распознаваемых слушающим.

Так, в пределах звукозаписи одного и того же звучащего текста исходя из коммуникативного намерения и экстралингвистической ситуации допроса говорящий может продуцировать различные формы речи. Ему может быть предложено прочитать письменный текст, он может отвечать на самые разные как ожидаемые им, так и неожиданные вопросы, давать заранее обдуманные и согласованные с адвокатом показания и т.д. и т.п.

При этом необходимо отметить, что единицы лексического и грамматического уровней закреплены как единицы языка и употребляются логично и последовательно, в случае если человек владеет языком, на котором осуществляется речевое общение. Нужно иметь в виду и возможное намеренное искажение индивидуальной манеры речи, когда говорящий в силу определенных условий и обстоятельств желает создать впечатление иной стилистической манеры или иного стиля речи, отличного от присущей ему манеры. Причем изменению в первую очередь подвергаются лексические и грамматические элементы.

Например, употребление деепричастий не свойственно спонтанной речи. Однако, иногда, оперируя небольшим запасом синтаксических моделей, говорящий употребляет значительное число деепричастий для создания восприятия плавности речи, или чтобы замаскировать присущую ему манеру речи. Такие ситуации не редки при отборе сравнительных образцов, когда говорящий сознательно контролирует свои высказывания, избегает употреблять "любимые" им слова и выражения, использует нейтральную частотную лексику, нанизывая стандартные синтаксические конструкции и грамматические формы.

Для спонтанной формы звучащей речи типично "нанизывание" наиболее часто встречаемых просодических и мелодических моделей. Реально просодических моделей достаточно много, но их реализация может быть ограничена рамками диалогической формы речи, где просодические параметры детерминированы вопросами-ответами. Это связано с тем, что синтаксическое строение спонтанного звучащего текста имеет свою специфику, выражающуюся в сокращении типов синтаксических моделей высказываний и сокращения числа осложненных конструкций.

В мелодическом оформлении спонтанные тексты также связываются в единое целое посредством последовательного нанизывания однотипных ритмико-мелодических схем синтагм. Наиболее часто встречаются модели неконечного завершения и модели слабой незавершенности с ровным движением тона или небольшим подъемом мелодики на завершителе синтагмы.

В конкретных задачах распознавания индивидуальных и групповых характеристик говорящего спонтанные и квазиспонтанные устные тексты реализуются во множестве просодем, фразовых акцентов и индивидуальных особенностей реализации единиц всех языковых уровней в пределах широкой литературной нормы. При этом сама специфика спонтанной и квазиспонтанной формы речи диктует особую форму реализации конечной цели в виде раскрытия темы сообщения блоками единиц кратковременной памяти, что соответственно маркируется сигналами незавершенности процесса речевого порождения.

Таким образом, при определении стратегии и тактики всего речевого исследования необходимо учитывать лингвистические и экстралингвистические факторы.