
- •Глава 7. Коммуникация
- •7.1 Восприятие и порождение речи
- •7.1.1 Фонологическое восприятие
- •7.1.2 Развитие языка и речевых действий
- •7.1.3 Нейропсихологические синдромы и модели порождения
- •7.2 Анализ процессов чтения
- •7.2.1 Развитие навыков чтения
- •7.2.2 Модели и нейропсихология чтения
- •7.2.3 Движения глаз при чтении
- •7.3 Когнитивные исследования грамматики
- •7.3.1 Проверка трансформационной модели
- •7.3.3 Современные модели и данные нейролингвистики
- •7.4 Прагматика коммуникативных ситуаций
- •7.4.1 Принцип кооперативности и понимание
- •7.4.2 Несовпадение значения и смысла
- •7.4.3 Технологические применения прагматики
7.4.3 Технологические применения прагматики
Поддержка процессов коммуникации выдвигается на первый план в современных технологических приложениях когнитивных исследований. Специальной прикладной дисциплиной, занимающейся оптимизацией взаимодействия человека и компьютера, стала возникшая в начале 1980-х годов (с появлением графических интерфейсов и персональных
169
170
компьютеров) когнитивная эргономика. В более широком плане оптимизацией человеко-машинных взаимодействий продолжают заниматься такие дисциплины, как инженерная психология и, что примерно идентично по значению, но более продвинуто непосредственно в область промышленных разработок (R&D, Research and Development — исследование и развитие), инженерия человеческих факторов. Наконец, специфический анализ и моделирование (или «извлечение») знаний являются предметом инженерии знаний, связывающей такие разделы когнитивной психологии, как психосемантика, с информатикой и искусственным интеллектом, а с недавних пор и с работами в области искусственных нейронных сетей (см. 2.3.3 и 9.2.3).
Простейшее применение изложенных в этой главе данных — простейшее по идее, а не по реализации, требующей кропотливого психофизического и лингвистического анализа, а также достаточно сложного программирования, — состоит в создании систем, дублирующих фонологический канал взаимодействия в зрительной модальности, как это имеет место при непосредственном речевом общении. Эти системы «видимой речи» иногда называют также «говорящими головами», поскольку они представляют собой показываемые на экране головы с движущимися в соответствии с фонетикой речи губами (Massaro, 1995). В качестве интерфейса, присоединенного к телефону, «видимая речь» должна поддерживать речевое общение людей с нарушениями слуха. Эти же системы могут использоваться для более эффективного речевого обучения слабослышащих детей. Наконец, данная частная технология нужна в качестве элементарной составляющей при создании виртуальных коммуницирующих агентов — дикторов индивидуально подобранных по интересам новостей, персональных секретарей, продавцов и менеджеров интернет-магазинов и т.п.
Практическое применение (защищенное несколькими патентами) находят работы по латентному семантическому анализу (см. 6.1.1 и 7.4.2). Он используется, например, для определения индивидуального профиля интересов покупателей интернет-магазинов. Каждый выбор книги в интернет-магазине фирмы AMAZON сопровождается определением семантического вектора интересов, к которому автоматически подбираются наиболее похожие книги, сразу же предлагаемые для покупки (обычно в пакете двух-трех наименований). Последующее взаимодействие позволяет еще более точно определить профиль интересов данного клиента. Понятно, что эта же когнитивная технология может использоваться и в целом ряде других практически важных ситуаций — подборе работы по интересам и квалификации клиента, нахождении сходных по содержанию текстов при полном различии составляющих эти тексты слов и, например, при автоматической оценке качества перевода текстов с одного языка на другой.
Фундаментальная проблема состоит в поддержке коммуникации, которая включена в процессы решения некоторых конкретных опосредованных использованием компьютеров практических задач (CSCW, computer supported cooperative work — поддерживаемая компьютерами совместная работа). В отличие от развернутого речевого общения процессы практического взаимодействия включают массу экстралингвистических, или «синпрактических», компонентов. Космонавт, пытающийся укрепить солнечную батарею, авиамеханик, находящийся внутри ремонтируемого им двигателя, военный медик, делающий операцию, или мобильный робот, демонтирующий ядерный реактор, часто нуждаются в строго дозированной в пространстве и времени подсказке экспертов, иногда находящихся за сотни километров от места событий. Поиск решения связан с предоставлением всем участникам общения наряду с акустическим каналом связи видеоизображения рабочей зоны, генерируемого с помощью одной или нескольких телевизионных камер. Однако видеоизображение ситуации в целом еще недостаточно специфично, чтобы быстро и однозначно определить предметные референты практических инструкций типа «Соедини эту штуковину с той» или «Убери камень с правой стороны».
Некоторое время назад нами было предложено явно вводить в опосредованное компьютерами общение информацию о фокусе внимания и интенциях участников (Velichkovsky & Hansen, 1996). Речь идет прежде всего о поддержке операций совмещения внимания участниками общения. Эффекты совместного внимания (joint attention) и их взаимодействие с речью хорошо известны из исследований онтогенеза (см. 7.1.2). Еще Выготский отмечал, что социализация внимания является важнейшим условием речевого и интеллектуального развития младенца. В первые месяцы жизни называние взрослым некоторого объекта увеличивает продолжительность его зрительной фиксации младенцем по сравнению с фиксацией других объектов, одновременно присутствующих в поле зрения (Bornstein, 1996). При возникновении речевой коммуникации характер речи во время фаз «совместного внимания» и вне них оказывается различным как по семантике, так и по синтаксису (Tomasello, 1996). В дальнейшем мы остаемся чрезвычайно чувствительны к направлению взора наших визави (нечувствительность к нему является одним из важнейших диагностических признаков аутизма)*9. Можно сказать, что отслеживание и учет распределения внимания
4 9 Для изучения особенностей реагирования на другого человека в последнее время успешно используются методики предъявления виртуальных антропоморфных агентов, аватаров. Эти исследования (Helmert et al., 2005, Schilbach et al, 2005) свидетельствуют о том, что очень похожие по психофизическим параметрам социальные стимулы могут об рабатываться на разных уровнях когнитивной организации в зависимости от личной вов леченности испытуемого, которая определяется прежде всего контактом «глаза в глаза» (см. 9.4.2). 171
партнеров — одно из важнейших условий успешного общения и организации совместной деятельности
Современные коммуникативные технологии, такие как электронная почта, интернет и видеоконференции, позволяют исключительно быстро, в режиме близком к реальному времени передавать гигантские объемы текстовой и визуальной информации При этом, однако, отчасти теряется важнейшая информация о динамике внимания участников общения В результате значительная часть диалогов участников видеоконференций посвящена не обсуждаемым проблемам, а самому процессу коммуникации («Кому ты это сейчас говоришь7»), а вероятность полетов менеджеров крупных корпораций друг к другу после проведения телеконференций часто возрастает, а не уменьшается Применение основанных на видеообработке систем регистрации движений глаз может быть необходимым дополнением существующих коммуникационных технологий Действительно, передача информации о том, где в предметном окружении в данный момент находится точка фиксации и, следовательно (с известными оговорками — см 4 3 1), фокус зрительного внимания позволяет формировать состояния «совместного внимания», значительно облегчая решение конструктивных задач кооперативного типа (Vehchkovsky, 1995)50
Тот же прием делает возможным отслеживание социальной микродинамики диалогов участников видеоконференций На рис 7 9А показана современная версия более ранней экспериментальной системы GAZE (ВЗОР), которая включала регистрацию направления взора участников обсуждения (Vertegaal, Vehchkovsky & Van der Veer, 1997) Такая бесконтактная регистрация движений глаз, основанная на автоматическом слежении за зрачком в видеоизображении, упоминалась нами в одной из предыдущих глав (см 2 4 2) Если некоторый участник (партнер 1) обсуждения обращается к другому участнику (партнер 2), фиксируя лицо этого участника на экране компьютера, то на мониторах всех других партнеров изображение лица и глаза партнера 1 поворачиваются в направлении изображения лица партнера 2, так что доминирующая межличностная направленность обращения становится очевидной Путем высвечивания местоположения фокуса зрительного внимания (например, с цветовой маркировкой для идентификации участника) в совместном рабочем поле данная методика делает также возможным выделение объектных референтов речи На рис 7 9Б показана еще одна современ-
50 Следует отметить, что зрительные фиксации могут выполнять несколько разных функций, таких как относительно поверхностная, амбьентная обработка или же фокальная обработка, направленная на идентификацию объектов (см , например, 3 4 2) Коммуникативную нагрузку несут скорее продолжительные фиксации длительностью более 500 мс Фильтрация подобных фиксаций позволяет, кстати, использовать взгляд в качестве замены традиционной компьютерной мышки (Vehchkovsky & Hansen, 1996) Это важно при затруднениях в использовании рук и речевого ввода информации, в частности, парализованными людьми В настоящее время во всем мире используется несколько сотен систем управления компьютерами (а следовательно, и множеством других технических систем) с помощью взора для инициации команд нужно просто чуть внимательнее по-172 смотреть на соответствующий иконический знак
ная коммуникационная система такого рода, используемая для проектирования новых изделий в автомобильной промышленности (с разрешения фирмы DaimlerChrysler)
Интересно, что проблема эксплицитного выявления фокуса внимания весьма остро стоит и в случае других современных коммуникационных технологий Так, развитие собственно речевого взаимодействия с компьютерами и вообще разнообразными техническими системами
173
сдерживается тем обстоятельством, что существующие голосовые интерфейсы, к сожалению, не обладают способностью к селективному восприятию, например, в его специфической форме, известной в когнитивной психологии как эффект вечеринки (см. 2.2.1). Эти устройства просто пытаются обработать все, что произносится в непосредственной от них близости. Поэтому и здесь очень важной представляется задача разработки чувствительных к вниманию пользователя интерфейсов.
Выявление интенций представляет собой следующий, еще более сложный и важный этап в развитии технологических приложений когнитивных исследований по сравнению с описанными попытками включения параметров внимания в процессы коммуникации. Основная перспектива здесь состоит в создании совершенно нового, некомандного принципа взаимодействия человека и технических систем. Попробуем проиллюстрировать эту идею двумя примерами актуальных практических разработок. Первый пример уже кратко упоминался в этой главе, в разделе, посвященном чтению (см. 7.2.3). Почему иностранный язык нужно, по возможности, учить в живом общении с носителями языка? Потому что при межличностном взаимодействии происходит постоянное отслеживание затруднений партнера и поддержка предоставляется тогда, когда надо, и в объеме, который необходим для данной ситуации. Нельзя ли смоделировать подобную гибкую поддержку, оказываемую без эксплицитного запроса (то есть «без команды» — некомандный принцип) со стороны испытывающего затруднения пользователя и без обычного отвлекающего от контекста «путешествия» по словарям и тезаурусам?
Поскольку значительная часть эмпирических данных по текущему анализу процессов понимания накоплены в области чтения, именно здесь наметился прорыв к новым решениям. Идея состоит в том, чтобы в самом текущем процессе (то есть в режиме on-line) чтения иностранного текста детектировать сочетания параметров движений глаз, свидетельствующих о возникших трудностях понимания (как отмечалось выше, такими признаками являются прежде всего регрессии — возвраты к некоторому слову одновременно с увеличением длительности фиксаций), и осуществлять дозированную подсказку перевода в родном или любом другом удобном для читателя языке. Первый прототип подобного интеллектуального интерфейса iDICT, разработанный финскими ин-форматиками совместно с немецкой фирмой SensoMotoric Instruments, был показан в конце 2005 года. Он содержит три функциональных блока: 1) лингвистический модуль, описывающий структуру текста и прогнозирующий сложность отдельных его компонентов; 2) модуль знаний о параметрах движений глаз при обычном чтении и при возникновении трудностей понимания; 3) коннекционистский модуль, обеспечивающий адаптацию к индивидуальным особенностям движений глаз.
Второй пример связан с усилиями, направленными на повышение бе зопасности автотранспорта. Основной причиной столкновений на скоро стных магистралях, иногда вовлекающих десятки машин, является нару- 174 шение правила сохранения дистанции до впереди едущего автомобиля.
Устройства, автоматически выдерживающие нужное расстояние с учетом скорости, условий видимости и параметров поверхности дороги, давно созданы. Эти так называемые ACCs — от Adaptive Cruise Control — сканируют окружение, выделяют другие машины и поддерживают по отношению к ним определенное, зависящее от перечисленных выше условий расстояние, так что если водитель хочет двигаться слишком быстро, приближаясь к впереди едущей машине, педаль газа становится более жесткой. Однако вскоре выявилась следующая проблема: если водитель вынужден отключить подобное устройство для осуществления обгона, то потом оно им почему-то не включается. Традиционный принцип «коммуникации» человека и машины посредством эксплицитных команд здесь не работает. Некомандное решение проблемы разрабатывается, в частности, в рамках проекта под названием «Что человеческий глаз говорит мозгу автомобиля». При этом отслеживаются паттерны движений глаз, характерные для интенции обгона. При возникновении такого паттерна система блокировки скорости отключается сама, а при восстановлении обычного режима визуального сканирования — включается вновь.
Хотя и со значительной задержкой по сравнению с естественными науками психология начинает влиять на пути развития высоких технологий. Часто мы даже не знаем слов, которые будут использоваться для обозначения всех этих новых направлений прикладных исследований. Самое последнее предложение состоит в том, чтобы называть их «когнитивными техническими системами». Не имеет пока устойчивого названия и работа по психологической поддержке технологий «виртуальных форм жизни» — интеллектуальных «действующих лиц» (агентов и авата-ров — Поспелов, 2003; Schilbach et al., 2005), а также область исследований, связанная с оптимизацией взаимодействия человека с мобильными роботами, а не просто с обычными стационарными компьютерами (см. 2.1.2, 9.2.3 и 9.4.2). Нет, впрочем, никакого сомнения, что речь идет при этом о возникновении совершенно нового поколения адаптивных человеко-машинных систем. Задача разработки этих технологий 21-го века является самым серьезным практическим вызовом экспериментальной психологии и когнитивной науке за всю историю их существования.