Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Хретоматия_коммуникация.doc
Скачиваний:
16
Добавлен:
25.08.2019
Размер:
856.06 Кб
Скачать

7.4.3 Технологические применения прагматики

Поддержка процессов коммуникации выдвигается на первый план в со­временных технологических приложениях когнитивных исследований. Специальной прикладной дисциплиной, занимающейся оптимизацией взаимодействия человека и компьютера, стала возникшая в начале 1980-х годов (с появлением графических интерфейсов и персональных

169

170

компьютеров) когнитивная эргономика. В более широком плане оптими­зацией человеко-машинных взаимодействий продолжают заниматься такие дисциплины, как инженерная психология и, что примерно иден­тично по значению, но более продвинуто непосредственно в область промышленных разработок (R&D, Research and Development исследо­вание и развитие), инженерия человеческих факторов. Наконец, специфи­ческий анализ и моделирование (или «извлечение») знаний являются предметом инженерии знаний, связывающей такие разделы когнитивной психологии, как психосемантика, с информатикой и искусственным интеллектом, а с недавних пор и с работами в области искусственных нейронных сетей (см. 2.3.3 и 9.2.3).

Простейшее применение изложенных в этой главе данных — про­стейшее по идее, а не по реализации, требующей кропотливого психо­физического и лингвистического анализа, а также достаточно сложного программирования, — состоит в создании систем, дублирующих фоно­логический канал взаимодействия в зрительной модальности, как это имеет место при непосредственном речевом общении. Эти системы «ви­димой речи» иногда называют также «говорящими головами», посколь­ку они представляют собой показываемые на экране головы с движущи­мися в соответствии с фонетикой речи губами (Massaro, 1995). В качестве интерфейса, присоединенного к телефону, «видимая речь» должна поддерживать речевое общение людей с нарушениями слуха. Эти же системы могут использоваться для более эффективного речевого обучения слабослышащих детей. Наконец, данная частная технология нужна в качестве элементарной составляющей при создании виртуаль­ных коммуницирующих агентов — дикторов индивидуально подобран­ных по интересам новостей, персональных секретарей, продавцов и ме­неджеров интернет-магазинов и т.п.

Практическое применение (защищенное несколькими патентами) находят работы по латентному семантическому анализу (см. 6.1.1 и 7.4.2). Он используется, например, для определения индивидуального профиля интересов покупателей интернет-магазинов. Каждый выбор книги в интернет-магазине фирмы AMAZON сопровождается опреде­лением семантического вектора интересов, к которому автоматически подбираются наиболее похожие книги, сразу же предлагаемые для по­купки (обычно в пакете двух-трех наименований). Последующее взаи­модействие позволяет еще более точно определить профиль интересов данного клиента. Понятно, что эта же когнитивная технология может использоваться и в целом ряде других практически важных ситуаций — подборе работы по интересам и квалификации клиента, нахождении сходных по содержанию текстов при полном различии составляющих эти тексты слов и, например, при автоматической оценке качества пе­ревода текстов с одного языка на другой.

Фундаментальная проблема состоит в поддержке коммуникации, которая включена в процессы решения некоторых конкретных опосре­дованных использованием компьютеров практических задач (CSCW, computer supported cooperative work — поддерживаемая компьютерами со­вместная работа). В отличие от развернутого речевого общения процес­сы практического взаимодействия включают массу экстралингвисти­ческих, или «синпрактических», компонентов. Космонавт, пытающийся укрепить солнечную батарею, авиамеханик, находящийся внутри ре­монтируемого им двигателя, военный медик, делающий операцию, или мобильный робот, демонтирующий ядерный реактор, часто нуждаются в строго дозированной в пространстве и времени подсказке экспертов, иногда находящихся за сотни километров от места событий. Поиск ре­шения связан с предоставлением всем участникам общения наряду с акустическим каналом связи видеоизображения рабочей зоны, генери­руемого с помощью одной или нескольких телевизионных камер. Од­нако видеоизображение ситуации в целом еще недостаточно специфич­но, чтобы быстро и однозначно определить предметные референты практических инструкций типа «Соедини эту штуковину с той» или «Убери камень с правой стороны».

Некоторое время назад нами было предложено явно вводить в опосредованное компьютерами общение информацию о фокусе внима­ния и интенциях участников (Velichkovsky & Hansen, 1996). Речь идет прежде всего о поддержке операций совмещения внимания участника­ми общения. Эффекты совместного внимания (joint attention) и их взаи­модействие с речью хорошо известны из исследований онтогенеза (см. 7.1.2). Еще Выготский отмечал, что социализация внимания является важнейшим условием речевого и интеллектуального развития младен­ца. В первые месяцы жизни называние взрослым некоторого объекта увеличивает продолжительность его зрительной фиксации младенцем по сравнению с фиксацией других объектов, одновременно присутству­ющих в поле зрения (Bornstein, 1996). При возникновении речевой ком­муникации характер речи во время фаз «совместного внимания» и вне них оказывается различным как по семантике, так и по синтаксису (Tomasello, 1996). В дальнейшем мы остаемся чрезвычайно чувствитель­ны к направлению взора наших визави (нечувствительность к нему яв­ляется одним из важнейших диагностических признаков аутизма)*9. Можно сказать, что отслеживание и учет распределения внимания

4 9 Для изучения особенностей реагирования на другого человека в последнее время успешно используются методики предъявления виртуальных антропоморфных агентов, аватаров. Эти исследования (Helmert et al., 2005, Schilbach et al, 2005) свидетельствуют о том, что очень похожие по психофизическим параметрам социальные стимулы могут об­ рабатываться на разных уровнях когнитивной организации в зависимости от личной вов­ леченности испытуемого, которая определяется прежде всего контактом «глаза в глаза» (см. 9.4.2). 171

партнеров — одно из важнейших условий успешного общения и орга­низации совместной деятельности

Современные коммуникативные технологии, такие как электронная почта, интернет и видеоконференции, позволяют исключительно быст­ро, в режиме близком к реальному времени передавать гигантские объе­мы текстовой и визуальной информации При этом, однако, отчасти теряется важнейшая информация о динамике внимания участников об­щения В результате значительная часть диалогов участников видеокон­ференций посвящена не обсуждаемым проблемам, а самому процессу коммуникации («Кому ты это сейчас говоришь7»), а вероятность поле­тов менеджеров крупных корпораций друг к другу после проведения те­леконференций часто возрастает, а не уменьшается Применение осно­ванных на видеообработке систем регистрации движений глаз может быть необходимым дополнением существующих коммуникационных технологий Действительно, передача информации о том, где в предмет­ном окружении в данный момент находится точка фиксации и, следова­тельно (с известными оговорками — см 4 3 1), фокус зрительного вни­мания позволяет формировать состояния «совместного внимания», значительно облегчая решение конструктивных задач кооперативного типа (Vehchkovsky, 1995)50

Тот же прием делает возможным отслеживание социальной микро­динамики диалогов участников видеоконференций На рис 7 9А по­казана современная версия более ранней экспериментальной системы GAZE (ВЗОР), которая включала регистрацию направления взора участ­ников обсуждения (Vertegaal, Vehchkovsky & Van der Veer, 1997) Такая бес­контактная регистрация движений глаз, основанная на автоматическом слежении за зрачком в видеоизображении, упоминалась нами в одной из предыдущих глав (см 2 4 2) Если некоторый участник (партнер 1) об­суждения обращается к другому участнику (партнер 2), фиксируя лицо этого участника на экране компьютера, то на мониторах всех других партнеров изображение лица и глаза партнера 1 поворачиваются в на­правлении изображения лица партнера 2, так что доминирующая меж­личностная направленность обращения становится очевидной Путем высвечивания местоположения фокуса зрительного внимания (напри­мер, с цветовой маркировкой для идентификации участника) в совмест­ном рабочем поле данная методика делает также возможным выделение объектных референтов речи На рис 7 9Б показана еще одна современ-

50 Следует отметить, что зрительные фиксации могут выполнять несколько разных функций, таких как относительно поверхностная, амбьентная обработка или же фокаль­ная обработка, направленная на идентификацию объектов (см , например, 3 4 2) Комму­никативную нагрузку несут скорее продолжительные фиксации длительностью более 500 мс Фильтрация подобных фиксаций позволяет, кстати, использовать взгляд в качестве замены традиционной компьютерной мышки (Vehchkovsky & Hansen, 1996) Это важно при затруднениях в использовании рук и речевого ввода информации, в частности, пара­лизованными людьми В настоящее время во всем мире используется несколько сотен систем управления компьютерами (а следовательно, и множеством других технических систем) с помощью взора для инициации команд нужно просто чуть внимательнее по-172 смотреть на соответствующий иконический знак

ная коммуникационная система такого рода, используемая для проекти­рования новых изделий в автомобильной промышленности (с разреше­ния фирмы DaimlerChrysler)

Интересно, что проблема эксплицитного выявления фокуса вни­мания весьма остро стоит и в случае других современных коммуникаци­онных технологий Так, развитие собственно речевого взаимодействия с компьютерами и вообще разнообразными техническими системами

173

сдерживается тем обстоятельством, что существующие голосовые ин­терфейсы, к сожалению, не обладают способностью к селективному восприятию, например, в его специфической форме, известной в ког­нитивной психологии как эффект вечеринки (см. 2.2.1). Эти устройства просто пытаются обработать все, что произносится в непосредственной от них близости. Поэтому и здесь очень важной представляется задача разработки чувствительных к вниманию пользователя интерфейсов.

Выявление интенций представляет собой следующий, еще более сложный и важный этап в развитии технологических приложений ког­нитивных исследований по сравнению с описанными попытками вклю­чения параметров внимания в процессы коммуникации. Основная пер­спектива здесь состоит в создании совершенно нового, некомандного принципа взаимодействия человека и технических систем. Попробуем проиллюстрировать эту идею двумя примерами актуальных практичес­ких разработок. Первый пример уже кратко упоминался в этой главе, в разделе, посвященном чтению (см. 7.2.3). Почему иностранный язык нужно, по возможности, учить в живом общении с носителями языка? Потому что при межличностном взаимодействии происходит постоян­ное отслеживание затруднений партнера и поддержка предоставляется тогда, когда надо, и в объеме, который необходим для данной ситуации. Нельзя ли смоделировать подобную гибкую поддержку, оказываемую без эксплицитного запроса (то есть «без команды» — некомандный принцип) со стороны испытывающего затруднения пользователя и без обычного отвлекающего от контекста «путешествия» по словарям и тезаурусам?

Поскольку значительная часть эмпирических данных по текущему анализу процессов понимания накоплены в области чтения, именно здесь наметился прорыв к новым решениям. Идея состоит в том, чтобы в самом текущем процессе (то есть в режиме on-line) чтения иностран­ного текста детектировать сочетания параметров движений глаз, свиде­тельствующих о возникших трудностях понимания (как отмечалось выше, такими признаками являются прежде всего регрессии — возвраты к некоторому слову одновременно с увеличением длительности фикса­ций), и осуществлять дозированную подсказку перевода в родном или любом другом удобном для читателя языке. Первый прототип подобно­го интеллектуального интерфейса iDICT, разработанный финскими ин-форматиками совместно с немецкой фирмой SensoMotoric Instruments, был показан в конце 2005 года. Он содержит три функциональных бло­ка: 1) лингвистический модуль, описывающий структуру текста и про­гнозирующий сложность отдельных его компонентов; 2) модуль знаний о параметрах движений глаз при обычном чтении и при возникновении трудностей понимания; 3) коннекционистский модуль, обеспечиваю­щий адаптацию к индивидуальным особенностям движений глаз.

Второй пример связан с усилиями, направленными на повышение бе­ зопасности автотранспорта. Основной причиной столкновений на скоро­ стных магистралях, иногда вовлекающих десятки машин, является нару- 174 шение правила сохранения дистанции до впереди едущего автомобиля.

Устройства, автоматически выдерживающие нужное расстояние с уче­том скорости, условий видимости и параметров поверхности дороги, давно созданы. Эти так называемые ACCs — от Adaptive Cruise Control сканируют окружение, выделяют другие машины и поддерживают по отношению к ним определенное, зависящее от перечисленных выше ус­ловий расстояние, так что если водитель хочет двигаться слишком быст­ро, приближаясь к впереди едущей машине, педаль газа становится бо­лее жесткой. Однако вскоре выявилась следующая проблема: если водитель вынужден отключить подобное устройство для осуществления обгона, то потом оно им почему-то не включается. Традиционный прин­цип «коммуникации» человека и машины посредством эксплицитных команд здесь не работает. Некомандное решение проблемы разрабаты­вается, в частности, в рамках проекта под названием «Что человеческий глаз говорит мозгу автомобиля». При этом отслеживаются паттерны дви­жений глаз, характерные для интенции обгона. При возникновении та­кого паттерна система блокировки скорости отключается сама, а при восстановлении обычного режима визуального сканирования — включа­ется вновь.

Хотя и со значительной задержкой по сравнению с естественными науками психология начинает влиять на пути развития высоких техно­логий. Часто мы даже не знаем слов, которые будут использоваться для обозначения всех этих новых направлений прикладных исследований. Самое последнее предложение состоит в том, чтобы называть их «когни­тивными техническими системами». Не имеет пока устойчивого назва­ния и работа по психологической поддержке технологий «виртуальных форм жизни» — интеллектуальных «действующих лиц» (агентов и авата-ров — Поспелов, 2003; Schilbach et al., 2005), а также область исследова­ний, связанная с оптимизацией взаимодействия человека с мобильны­ми роботами, а не просто с обычными стационарными компьютерами (см. 2.1.2, 9.2.3 и 9.4.2). Нет, впрочем, никакого сомнения, что речь идет при этом о возникновении совершенно нового поколения адаптивных человеко-машинных систем. Задача разработки этих технологий 21-го века является самым серьезным практическим вызовом эксперименталь­ной психологии и когнитивной науке за всю историю их существования.