Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Собственно текст документа.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
8.39 Mб
Скачать

5.1.3. Использование метафор для выявления «скрытых» структур знаний

Несмотря на кажущуюся близость задач, инженерия знаний и психосемантика существенно отличаются как в теоретических основаниях, на которых они бази­руются, так и в практических методиках. Но главное отличие заключается в том, что инженерия знаний направлена на выявление - в конечном итоге - модели рассуждений [Поспелов, 1989], динамической или операциональной составляю­щей ментального пространства (или функциональной структуры поля знаний Sf), в то время как психосемантика, пытаясь представить ментальное простран­ство в виде евклидова пространства, позволяет делать видимой статическую структуру взаимного «расположения» объектов в памяти, в виде проекций скоплений объектов (концептуальная структура Sk).

Помимо этого следует отметить ряд недостатков методов психосемантики с точ­ки зрения практической инженерии знаний.

1. Поскольку в основе психосемантического эксперимента лежит процедура из­мерения субъективных расстояний между предъявляемыми стимулами, то и результаты обработки такого эксперимента, как правило, используют геомет­рическую интерпретацию - евклидово пространство небольшого числа изме­рений (чаще всего - двумерное). Такое сильное упрощение модели памяти может привести к неадекватным базам знаний.

2. Естественность иерархии как глобальной модели понятийных структур созна­ния служит методологической базой ОСП. Кроме того, и в естественном языке понятия явно тяготеют к различным уровням обобщения. Однако в большин­стве прикладных пакетов не предусмотрено разбиение семантического про­странства на уровни, отражающие различные степени общности понятий, вклю­ченных в экспериментальный план. В результате получаемые кластеры понятий, пространственно изолированные в геометрической модели шкали­рования, носят таксономически неоднородный характер и трудно поддаются интерпретации.

3. Единственные отношения, выявляемые процедурами психосемантики, - это «далеко - близко» по некоторой шкале. Для проектирования и построения баз знаний выявление отношений является на порядок более сложной задачей, чем выявление понятий. Поэтому семантические пространства, полученные в ре­зультате шкалирования и кластеризации, должны быть подвергнуты дальней­шей обработке на предмет определения отношений, особенно функциональ­ных и каузальных.

Нельзя ожидать, что эти противоречия могут быть разрешены быстро и безболез­ненно, в силу того, что математический аппарат, положенный в основу всех паке­тов прикладных программ по психосемантике, имеет определенные границы применимости. Однако одним из возможных путей сближения без нарушения чистоты процедуры видится расширение пространства конкретных объектов-стимулов предметной области за счет добавления некоторых абстрактных объек­тов из мира метафор, которые заставят эксперта-испытуемого выйти за рамки объективности в мир субъективных представлений, которые зачастую в большей степени влияют на его рассуждения и модель принятия решений, чем традицион­ные правильные взгляды.

Ниже описан подход, разработанный совместно с Воиновым А. В. [Voinov, Gavrilova, 1993; Воинов, Гаврилова, 1994] и позволяющий вывести эксперта за гра­ницы традиционной установки и тем самым выявить субъективные, часто скры­ваемые или скрытые структуры его профессионального опыта.

Большинство результатов, полученных в когнитивной психологии, подтвержда­ют, что у человека (в том числе и у эксперта) формальные знания о мире (в част­ности, о той предметной области, где он является экспертом) и его личный пове­денческий опыт не могут существовать изолированно, они образуют целостную, стабильную структуру. В западной литературе за этой структурой закрепилось название «модель (или картина) мира». Принципиальным свойством модели мира является то, что ее структура не дана человеку - ее носителю - в интрос­пекции, она работает на существенно латентном, неосознаваемом уровне, зачас­тую вообще ничем не отмеченном (в символической форме) на поверхности вер­бального сознания.

Изучение модели мира человека является задачей когнитивной психологии, пси­хосемантики и прочих родственных дисциплин. Что же касается эксперта как объекта пристального внимания инженерии знаний, то здесь одна из проблем, в решении которых может помочь психосемантика, связана с необходимостью (и неизбежностью) отделения опыта эксперта от его объективных знаний в про­цессе формализации и структурирования, последних для экспертных систем.

Строго говоря, невозможно указать ту грань, за которой знания (которые можно формализовать и извлечь) переходят в опыт (то есть в то, что остается уникаль­ной, неотчуждаемой собственностью эксперта). Более корректно, по-видимому, говорить о неком континууме, детальность градации которого может зависеть от конкретной задачи.

Например, можно выделить следующие три уровня:

1. Знания, предназначенные для изложения или доказательства (аргументации), например, на междисциплинарном уровне или для популярной лекции (вер­бальные).

2. Знания, которые применяются в реальной практике, - знания еще вербализу­емые, но уже нерефлектируемые.

3. Собственно опыт, то есть знания, лежащие на наиболее глубоком, неосознава­емом уровне, отвечающие за те решения эксперта, которые внешне (в том чис­ле и для него самого) выглядят как мгновенное озарение или «инсайт», интуи­тивный творческий акт (интуитивные).

Классическая методика психосемантического эксперимента также не позволяет выделить из его результатов интуитивный уровень. Это видно из самой тестовой процедуры. Просят ли испытуемого оценить сходство-различие стимулов напря­мую или же предлагается оценить их соответствие некоторым «конструктам» - в любом случае испытуемый вольно или невольно настраивается на необходимость доказательности своего ответа в терминах объективных свойств стимулов.

Большинство методов извлечения знаний ориентировано на верхние - вербаль­ные или вербализируемые - уровни знания. Необходим косвенный метод, ори­ентированный на выявление скрытых предпочтений практического опыта или операциональных составляющих опыта. Таким методом может служить метафо­рический подход. Метафорический подход, впервые описанный с чисто лингвис­тических позиций [Black, 1962; Ricoeur, 1975], а также с позиций практической психологии [Гордон, 1987], был видоизменен для нужд инженерии знаний. На­пример, в экспериментах по объективному сравнению языков программирова­ния между собой были также использованы два метафорических «мира» - мир животных и мир транспорта.

В рамках этого подхода удалось экспериментально доказать следующие тезисы:

• метафора работает как фильтр, выделяющий, посредством подбора адекват­ного объекта сравнения, определенные свойства основного объекта (то есть того, о котором собственно и идет речь). Эти выделяемые свойства имеют су­щественно операциональный характер, проявляющийся на уровне полимор­физма методов, так как метафора по самой своей сути исключает возмож­ность сравнения объектов по их внутренним, объективным свойствам;

• метафора имеет целью скорее не сообщить что-либо о данном объекте (то есть ответить на вопрос «что это?»), а призвать к определенному отношению к нему, указать на некую парадигму, говорящую о том, как следует вести себя по отношению к данному объекту;

• субъективному сдвигу в отношении к основному объекту (например, к языку программирования) сопутствует также и сдвиг в восприятии объекта сравне­ния (например, к конкретному животному) в силу вышеуказанной специфики фильтруемых метафорой свойств. Поэтому объект сравнения выступает в ме­тафоре не по своему прямому назначению, то есть это не просто «лев» как представитель фауны, а воплощение силы, ловкости и могущества;

• в том случае, когда метафора сопоставляет не единичные объекты, а некоторые их множества, в которых объекты связаны осмысленными отношениями, про­странство объектов сравнения должно быть изоморфно пространству основ­ных объектов по системе указанных отношений.

На эти тезисы опирается предлагаемая модификация классической методики со­поставления объектов, применяемой, например, в оценочной решетке Келли [Kelly, 1955]. При проведении эксперимента была использовала система MEDIS [Алексеева, Воинов и др., 1989; Воинов, Гаврилова, 1994]. Эта система позволяет планировать, проводить и обрабатывать данные произвольного психосеманти­ческого эксперимента. Помимо классической парадигмы многомерного шкалиро­вания, система MEDIS включает в себя некоторые возможности теста репертуар­ных решеток. В частности, она позволяет работать со стимулами двух сортов - так называемыми элементами и конструктами (с единственным исключением: конструкты в системе MEDIS - в отличие от классического теста репертуарных решеток - монополярны). Естественно, выбор базового инструментария суще­ственно повлиял на описываемую экспериментальную реализацию методики. В качестве предметной области был выбран мир языков программирования. В про­странство базовых понятий (выступавших в методике в качестве элементов) бы­ло включено несколько более или менее популярных языков программирова­ния, принадлежащих к следующим классам:

• языки искусственного интеллекта;

• традиционные процедурные языки

• так называемые «макроязыки», обычно реализуемые в оболочках операцион­ных систем, текстовых редакторах и т. д.

В качестве метафорических пространств выбраны мир животных и мир транс­порта. Объекты этих миров выступали в методике в качестве (монополярных) конструктов. На первом этапе эксперимента каждый из респондентов выполнял классическое попарное субъективное шкалирование элементов. На вопрос, «Есть ли что-либо общее между данными языками программирования», рес­понденту предлагалось ответить одной из следующих альтернатив.

ДА!

1

Объекты очень близки

Да

2

Между объектами есть что-то общее

???

3

Неопределенный ответ

Нет

4

Объекты различны

НЕТ!

5

Объекты совершенно несовместимы

Данные этого этапа (отдельно для каждого из респондентов) подвергались об­работке методами многомерного шкалирования (см. выше) и представлены на рис. 5.4.

Результатом такой обработки является некоторое евклидово пространство не­большого числа измерений, в котором исходные оценки различий представлены геометрическими расстояниями между точками. Чем лучше эти расстояния соот­ветствуют исходным различиям, тем более адекватным считается результат обра­ботки в целом. При этом буквальное совпадение расстояний и числовых кодов ответов, естественно, не является обязательным (хотя оно и возможно в некото­рых модельных экспериментах). Более важным оказывается ранговое соответ­ствие расстояний исходным оценкам. А именно, в идеальном случае все расстоя­ния между точками, соответствующие (например) ответам «ДА!» в исходных данных, должны быть меньше (хотя бы и на доли процента масштаба шкалы) всех расстояний, соответствующих ответам «Да», и т. д.

В реальном эксперименте идеальное соответствие невозможно в принципе, так как целью обработки является сжатие, сокращение размерности данных, что ог­раничивает число координатных осей результирующего пространства. Тем не менее, алгоритм шкалирования пытается - насколько это возможно - миними­зировать ранговое несоответствие модели исходным данным.

Геометрическую модель шкалирования можно интерпретировать по-разному:

• во-первых, можно выяснить смысл координатных осей результирующего про­странства. Эти оси по сути своей аналогичны факторам в факторном анализе, что позволяет использовать соответствующую парадигму интерпретации, де­тально разработанную в экспериментальной психологии. В данном случае можно считать, что выявленные факторы играют роль базовых категорий, или базовых (латентных) конструктов, с помощью которых респондент (как пра­вило, неосознанно) упорядочивает свою картину мира (точнее, ее проекцию на данную предметную область);

• во-вторых, можно проанализировать компактные группировки стимулов в этом пространстве, отождествив их с некоторыми существенными (хотя и скрытыми от интроспекции) таксономическими единицами, реально при­сутствующими в модели мира эксперта. Существенно, что делается попытка интерпретировать кластеры, полученные по модели шкалирования, а не по исходным числовым кодам различий. Это вытекает из предположения, что информация, не воспроизводимая главными (наиболее нагруженными) фак­торами, является «шумом», сопутствующим любому (а особенно психологи­ческому) эксперименту.

Рисунок 5.4 отражает традиционную классификацию языков программирова­ния и легко поддается вербальной интерпретации. Например, на рисунке гори­зонтальная ось соответствует делению языков программирования на «языки ис­кусственного интеллекта» (левый полюс шкалы) и «традиционные языки программирования» (правый полюс). Вертикальная ось отражает классифика­цию языков программирования в зависимости от уровня - языки высокого уровня (нижний полюс) и языки низкого уровня или системные языки (верхний полюс).

Рис. 5.4. Классификация языков программирования

Основная экспериментальная процедура - попарное сравнение некоторых объек­тов и выражение степени их сходства (несходства) на числовой оси или выделе­ние пар близких объектов из предъявленной триады - сама по себе накладывает большое количество ограничений на выявляемую структуру, в частности:

1. Из-за выбора стимульного материала (выбор объектов остается за инженером по знаниям).

2. Из-за несовершенства шкалы измерений.

3. В связи с рядом допущений математического аппарата. Но главное, что полу­ченная структура знаний чаще всего носит академический характер, то есть отражает объективно существующие, но легко объяснимые, как бы лежащие на поверхности закономерности.

Это связано с психологической установкой самого эксперимента, во время кото­рого эксперта как бы проверяют, экзаменуют и он, естественно, стремится давать правильные ответы.

На следующем этапе эксперимента респонденту предлагалось сопоставить каж­дый из языков программирования с каждым из метафорических персонажей. Как и на первом этапе, пары предъявлялись в равномерно-случайном порядке (аналогичном расписанию кругового турнира в спортивных играх). Инструкция для со­поставления выглядела следующим образом:

Попробуйте оценить выразительную силу данной метафоры: «ЛИСП - это слон» или «C++ - это яхта».

Результирующая таблица числовых кодов оценок (идентичная оценочной решет­ке Келли) была также обработана методами многомерного шкалирования про­граммы МЕДИС. Результаты представлены на рис. 5.5 и 5.6.

Рис. 5.5. Метафорическая классификация языков программирования (мир животных)

Рис. 5.6. Метафорическая классификация языков программирования (мир транспорта)

При интерпретации удалось выявить такие латентные понятия и структуры, как «степень изощренности языка» (шкала X рис. 5.5), «сила» (шкала Y рис. 5.5), «универсальность» (шкала Y рис. 5.6), «скорость» (шкала X рис. 5.6) и др.

Кроме этого, полученные рисунки позволили выявить скрытые предпочтения эк­сперта и существенные характеристики объектов, выступавших в виде стиму­лов - «силу» языка С («слон»); скорость C++ («яхта»); «старомодность» Форт­рана («телега») и пр.

В применении к реальному процессу извлечения знаний это обстоятельство ста­новится принципиальным, так как позволяет на самом деле отделить те знания, благодаря которым эксперт является таковым (уровень В), от общезначимых, ба­нальных (для экспертов в данной предметной области) знаний (уровень А), кото­рые возможно и не стоят того, чтобы ради них создавать собственно экспертную систему.

Однако можно ожидать, что во многих (если не в большинстве) случаях выявлен­ные латентные структуры могут полностью перевернуть представления инжене­ра по знаниям о предметной области и позволить ему существенно углубить базу знаний. Введение мира метафор - это некая игра, а игра раскрепощает сознание эксперта и, как все игровые методики извлечения знаний (п. 4.2), является хоро­шим катализатором трудоемких серий интервью с экспертом, без которых сегод­ня невозможна разработка промышленных интеллектуальных систем.