Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Хрестоматия Том3 Книга2.doc
Скачиваний:
51
Добавлен:
24.01.2021
Размер:
21.89 Mб
Скачать

Тема 18. Экспериментальные исследования мышления

говорящий не будет проговаривать каждую посылку или каждое допуще­ние, и он понимает, что ему придется заполнять пробелы, делая обосно­ванные выводы о тех деталях, которые остались невысказанными.

Как мы относимся к этой модели разговорного сотрудничества? Одно описание было дано философом Х.П.Грайсом, который утверждал, что разговором управляет небольшое количество правил, или максим1, Одна из этих негласных максим — максима уместности — требует, что­бы партнеры по разговору говорили вещи, которые относятся к делу. Такое правило помогает нам понять следующий диалог.

Брайан: А где же ростбиф?

Фернанда: Не знаю, но у собаки весьма довольный вид.

Ответ Фернанды кажется совершенно не относящимся к заданному вопросу, но если мы принимаем максиму уместности Грайса, мы вынуж­дены искать связь между ее ответом и вопросом Брайана. Этот поиск уместности приводит к заключению, что собака могла украсть ростбиф. Другой пример касается максимы количества: партнеры в разговоре по­нимают, что они не должны говорить ни больше, ни меньше, чем это необходимо. Эта максима действует в следующем фрагменте диалога;

Т они: Как тебе понравились танцоры? Мария: Некоторые из них были очень хороши.

Здесь Мария подразумевает, что некоторые из танцоров были не хороши; мы понимаем, что «некоторые» означает «не все». Конечно, это толкование не следует логически из реплики Марии (если она думает, что все были хороши, то она могла с полным правом сказать, что некоторые были очень хороши). Тем не менее, мы делаем именно это заключение об оценке Марии, поскольку мы негласно предполагаем, что если бы она думала, что все танцоры были хороши, она бы так и сказала. В против­ном случае она нарушила бы максиму количества.

Эти максимы и общая динамика разговора позволяют говорящим оставлять многое невысказанным. Рассмотрим следующий отрывок из разговора2:

Женщина: Я ухожу от тебя. Мужчина (в гневе): Кто он?!

Мы можем легко сопроводить этот диалог мелодраматическим сце­нарием, придав большое значение богатству интерпретации, часто тре­буемому для понимания повседневного разговора3.

1 См.: Grice H.P. Logic and conversation. // P.Cole, J.L.Morgan (Eds.). Syntax and semantics 3: Speech acts. N. Y.: Academic Press, 1975.

2 См.: Pinker S. The language instinct. N. Y.: William Morrow, 1994.

3 Дополнительное обсуждение роли слушателя или читателя в понимании связной речи см.: Sperber D., Wilson D. Relevance: Communication and cognition. Oxford: Blackwell, 1986; Graesser A.C, Millie K.K., Zwaan RA. Discourse comprehension // Annual Review of Psychology. 1997. 48. P. 163-189.

Дж.Р. Андерсон [РАСПОЗНАВАНИЕ РЕЧИ И ПОНИМАНИЕ ЯЗЫКА]1

Распознавание речи

Главная проблема при распознавании речи — сегментация распоз­наваемых объектов. Речь не разбита на дискретные единицы, как печат­ный текст. Хотя кажется, что между словами в речи имеются четкие промежутки, часто это лишь иллюзия. При исследовании фактического физического речевого сигнала мы часто находим не уменьшающуюся интенсивность звука в границах слова. Действительно, снижение интен­сивности речи так же вероятно в пределах слова, как и между словами, Эта особенность речи особенно заметна, когда мы слушаем, как кто-то говорит на неизвестном иностранном языке. Речь кажется непрерывным потоком звуков без очевидных границ слов. Именно знание нашего соб­ственного языка ведет к иллюзии границ слова.

В пределах отдельного слова существуют еще большие проблемы с сегментацией. Эти проблемы включают в себя идентификацию фонем. Фонемы — это основной набор звуков речи; именно с их помощью мы распознаем слова2. Фонема определяется как минимальная единица речи, которая может обусловливать различия в произнесенных сообщениях. В качестве иллюстрации рассмотрим слово bat. В этом слове есть три фо­немы: [b], [а] и [t]. При замене [b] на фонему [р], мы получим pat; заме­нив [а] на [i], мы получим bit; заменив [t] на [n], мы получим ban. Оче­видно, не всегда существует однозначное соответствие между буквами и фонемами. Например, слово one состоит из фонем [w], [а] и [n]; school

1 Андерсон Д.Р. Когнитивная психология. СПб.: Питер, 2002. С. 63-71, 371-380.

2 Массаро (см.: Massaro D.W. Modeling multiple influences in speech perception // A.Dijkst, K. de Smedt (Eds.). Computational psycholingvistics: A and connectionist models of human language processing. London: Taylor and Francis, 1996. P. 85-113) предполагает, что основными перцептивными единицами являются комбинации гласных-согласных и согласных-гласных.

598 Тема 18. Экспериментальные исследования мышления

состоит из фонем [s], [k], [u] и [1]; knight состоит из [n], [i] и [t]. Именно отсутствие точного соответствия между буквами и звуками делает труд­ной английскую орфографию.

Проблема сегментации возникает, когда фонемы, образующие про­износимые слова, должны быть идентифицированы. Трудность состоит в том, что речь непрерывна и фонемы не дискретны, в отличие от букв на напечатанной странице. Сегментация на этом уровне подобна распозна­ванию написанного от руки сообщения, где одна буква переходит в дру­гую. Кроме того, разные люди по-разному произносят одни и те же фо­немы, подобно тому, как обладают разным почерком. Разница между говорящими особенно очевидна, когда человек впервые пытается пони­мать говорящего с сильным и незнакомым акцентом, например когда американец пытается понять австралийца. Но анализ речевого сигнала показывает, что даже среди говорящих с тем же самым акцентом суще­ствуют значительные вариации. Например, голоса женщин и детей обыч­но намного выше, чем голоса мужчин.

Еще одна трудность в восприятии речи включает в себя феномен, известный как коартикуляция1. Когда артикуляционный аппарат производит один звук, скажем [b] в bag, он начинает принимать форму, требующуюся для [а]. Когда он производит звук [а], он начинает прини­мать форму, требующуюся для [g]. В действительности различные фоне­мы накладываются друг на друга. Это создает дополнительные трудно­сти при сегментации фонем, и это также означает, что фактический звук, произведенный для одной фонемы, будет определен контекстом, который образуют другие фонемы.

Считается, что восприятие речи включает в себя специализирован­ные механизмы, которые выходят за рамки общих механизмов слухово­го восприятия. <...> Кроме того, есть пациенты, которые в результате поражения левой височной доли утратили способность лишь слышать речь2. Их способность обнаруживать и распознавать другие звуки не на­рушена, как и их способность говорить. Таким образом, их нарушение касается только восприятия речи. Иногда этим пациентам в некоторой степени удается распознать речь, если она очень медленная3, и это на­водит на мысль, что отчасти их проблема может заключаться в сегмен­тации речевого потока.

Распознавание речи включает в себя сегментацию фонем в непре­рывном потоке речи.

1 См.: Liberman A.M. The grammars of speech and language /7 Cognitive Psychology. 1970. 1. P. 301-323.

2 См.: Goldstein M.N. Auditory agnosia for speech («pure word deafness»): A historical review with current implications // Brain and Language. 1974. 1. P. 195-204.

3 См.: Okada S.. Hanada M., Hattori H., Shoyama T. A case of pure word-deafness // Studio Phonologica. 1963. 3. P. 58-65.

Андерсон Д.Р. [Распознавание речи и понимание языка]

599

Анализ особенностей речи

В основе восприятия речи, по-видимому, лежат почти такие же процессы, как подетальный анализ и комбинация деталей при зритель­ном распознавании. Как и отдельные буквы, отдельные фонемы можно рассматривать как характеризующиеся некоторым числом особенностей. Эти особенности связаны с тем, как порождена фонема. Фонемы могут различаться по таким признакам, как «согласные—гласные», «звонкие— глухие» и по месту артикуляции1. Согласные фонемы по звучанию отли­чаются от гласных. Звонкие фонемы получаются в результате вибрации голосовых связок. Например, сравните, как вы произносите пот и дот, трупы и трубы, фон и вон. Вы можете обнаружить это различие, поме­стив пальцы на вашей гортани, когда вы произносите эти звуки. Гортань будет вибрировать при звонком согласном.

Местом артикуляции называется место, в котором речевой канал закрыт или сжат при произнесении фонемы. (Он закрыт в определенной точке при произнесении большинства согласных.) Например, звуки [п] и [м] относятся к билабиальным, так как при их произнесении губы зак­рыты. Фонемы [ф] и [в] считаются лабио-дентальными, так как при их произнесении нижняя губа прижата к передним зубам. Фонемы [т], [д], [н], [л] и [р] — альвеолярными, потому что язык прижат к альвеолам. Фонемы [к] и [г] — задненёбные, потому что язык прижат к мягкому нёбу, или нёбной занавеске в задней части нёба.

Рассмотрим фонемы [п], [б], [т] и [д]. Все четыре — согласные, од­нако различаются по звучанию и месту артикуляции. В табл. 1 эти че­тыре согласных звука классифицированы в соответствии с этими двумя особенностями.

Классификация звуков [б], [п], [д] и [т] по звонкости—глухости и месту артикуляции

Т аблица 1

Существует немало доказательств роли таких особенностей в воспри­ятии речи. Например, Миллер и Найсли2 предлагали испытуемым по­пытаться на фоне шума опознать такие согласные, как [б], [д], [п] и [т]. На самом деле испытуемым предъявлялись звуки [ба], [да], [па] и [та]. Ис­пытуемые оказывались сбитыми с толку, полагая, что они слышали один

1 См.: Chomsky N.. Halle M. The sound pattern of English. N. Y.: Harper, 1968.

2 См.: Miller GA„ Nicely P. An analysis of perceptual confusions among some English consonants // Journal of the Acoustical Society of America. 1956. 27. P. 338-352.

600