Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Собственно текст документа.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
8.39 Mб
Скачать

5. Новые тенденции и прикладные аспекты инженерии знаний

□ Латентные структуры знаний и психосемантика

□ Метод репертуарных решеток

□ Управление знаниями

□ Визуальное проектирование баз знаний как инструмент познания

□ Проектирование гипермедиа БД и адаптивных обучающих систем

5.1. Латентные структуры знаний и психосемантика

Большинство систем приобретения знаний (обзор в п. 4.5) облегчают сложный и трудоемкий процесс формирования баз знаний и реализуют прямой диалог с экспертом. Однако выявляемые таким образом структуры знаний часто отражают лишь поверхностную составляющую знаний эксперта, не затрагивая их глубинной структуры. Этим же недостатком обладает большинство методов непосред­ственного извлечения знаний (параграфы 4.1.-4.3).

Для извлечения глубинных пластов экспертного знания можно воспользоваться методами психосемантики - науки, возникшей на стыке когнитивной психологии, психолингвистики, психологии восприятия и исследований индивидуаль­ного сознания. Психосемантика исследует структуры сознания через моделирование индивидуальной системы знаний [Петренко, 1988] и выявление тех категориальных структур сознания, которые могут не осознаваться (латентные, имплицитные или скрытые) [Петренко, 1983; Терехина, 1988; Шмелев, 1983].

5.1.1. Семантические пространства

и психологическое шкалирование

Основным методом экспериментальной психосемантики является метод рекон­струкции субъективных семантических пространств. Здесь психосемантика тес­но сплетается с психолингвистикой и лингвистической семантикой - с методо­логией выявления значений слов, лексикографией, «падежной грамматикой» и структурными исследованиями [Апресян, 1977; Мельчук, 1974; Соссюр, 1977; Филлмор, 1983; Щерба, 1974]. Однако лингвистические методы в основном на­правлены на анализ текстов, отчужденных от субъекта, от его мотивов и замыс­лов.

Психолингвистические методы обращаются непосредственно к испытуемому. Большинство из них связано с различными формами субъективного шкалирова­ния. Перед испытуемым ставится задача оценить «сходство знаний» с помощью некоторой градуированной шкалы, например от 0 до 5 или от 0 до 9. В этом случае исследователь получает в руки численно представленные стандартизированные данные, легко поддающиеся статистической обработке.

Психосемантика - как одно из молодых направлений современной психологии [Петренко, 1988; Шмелев, 1983] - сразу была оценена специалистами в области искусственного интеллекта как перспективный инструмент, позволяющий ре­конструировать семантическое пространство памяти как психологическую мо­дель глубинной структуры знаний эксперта. Уже первые приложения психосе­мантики в ИИ в середине 80-х годов позволили получить достаточно наглядные результаты. В психологии семантические пространства выступают как модель категориальной структуры индивидуального сознания. При концептуальном анализе знаний структуру семантического пространства эксперта можно считать основой для формирования поля знаний. При этом отдельные параметры семан­тического пространства соответствуют различным компонентам поля (размер­ность пространства соотносится со сложностью поля, выделенные понятийные структуры с метапонятиями, содержательные связи между понятиями-стиму­лами - это суть отношения и т. д.).

Легче всего познакомиться с экспериментальной психосемантикой на примере, связанном с выявлением структуры и размерности семантического пространства знаний из некоторой предметной области [Петренко, 1988].

В основе построения семантических пространств, как правило, лежит статисти­ческая процедура (например, факторный анализ [Аверкин, Батыршин, Блишун и др., 1986], многомерное шкалирование [Тиори, Фрай, 1985] или кластерный анализ [Дюран, Оделл, 1977]), позволяющая группировать ряд отдельных при­знаков описания в более емкие категории-факторы. Говоря на языке поля знаний, это - построение концептов более высокого уровня абстракции. При геометри­ческой интерпретации семантического пространства значение отдельного при­знака отображается как точка или вектор с заданными координатами внутри n-мерного пространства, координатами которого выступают выделенные факторы. Построение семантического пространства, таким образом, включает переход к описанию предметной области на более высоком уровне абстракции, то есть пе­реход от языка, содержащего большой алфавит признаков описания, к более ем­кому языку концептуализации, содержащему меньшее число концептов и вы­ступающему своеобразным метаязыком по отношению к первому.

В зависимости от опыта и профессиональной компетентности, испытуемых раз­мерность пространства и расположение в ней первичных понятий может суще­ственно варьироваться. Эта особенность семантических пространств может быть использована на стадии контроля в процессах обучения, при тестировании экс­периментов и пользователей.

Пример 5.1

Так, для проверки знаний и понимания английского языка в работе [Терехина, 1988] были взяты десять наиболее распространенных предлогов, достаточно трудно перево­димых. На экране дисплея испытуемому предъявлялась пара предлогов и спрашива­лось, часто ли у него вызывает затруднения выбор одного из этих предлогов. Степень затруднения оценивалась в баллах от 1 до 9. На этих данных методами многомерного шкалирования была построена структура сложности употребления английских пред­логов с точки зрения носителя русского языка. Эта модель существенно зависит от уровня знаний. Так, модель новичка не представляет организованной структуры. У людей, имеющих определенные навыки, проявилась некоторая структурирован­ность семантического пространства, в нем отчетливо обозначились пары и тройки сходных предлогов.

Рис. 5.1. Семантическое пространство близости английских предлогов

Наиболее четкая и связная структура приведена на рис. 5.1. По ней можно объяснить особенности дифференциации предлогов в английском языке. Основа структуры пред­ставляется в виде окружности, близкие точки на которой соответствуют трудно диф­ференцируемым предлогам. Структура опирается на две ортогональные оси. Ось абс­цисс соответствует предлогам направления движения, а ось ординат - предлогам цели - средства.

На основании получаемых методами психосемантики моделей можно проводить контроль знаний. При анализе индивидуальных семантических пространств вы­являются вопросы, которые не усвоены и не уложились в систему. Контроль структуры знаний проводится на основе сопоставления семантических про­странств хороших специалистов и новичков (студентов, слушателей, молодых специалистов). Степень согласованности семантических пространств (их размер­ности, признаки и конфигурации понятий) будет определять уровень знаний но­вичка.

Однако здесь необходимо учесть, что семантические пространства двух квалифи­цированных специалистов могут быть разными, так как содержат индивидуаль­ные различия восприятия, отражающие опыт и характер деятельности человека. Поэтому не всегда можно формально сравнить семантические пространства экс­перта и новичка, следует предварительно изучить семантические пространства нескольких специалистов, а затем уж производить сравнение.

В работе [Кук, Макдональд, 1986] описан подобный эксперимент. Были получе­ны когнитивные структуры знаний опытного летчика-истребителя и пилота-но­вичка, с использованием двух методов: многомерного шкалирования (алгоритм MDS - Alscal) и сетевого шкалирования со взвешенными связями (алгоритм Pathfinder). Оба алгоритма основаны на использовании оценок психологичес­кой близости. Опытный пилот и пилот-новичок оценивали все возможные пар­ные сочетания 30 связанных с полетом понятий, приписывая числа от 0 до 9 каж­дой паре, где 0 обозначал самую слабую степень связи между понятиями, а 9 -самую сильную. Эти оценки затем обрабатывались с применением обоих алго­ритмов шкалирования.

В соответствии с алгоритмами MDS каждый концепт, выражающий некоторое понятие, помещается в к-мерное пространство таким образом, что расстояние между точками отражает психологическую близость соответствующих кон­цептов. Алгоритм Pathfinder строит семантическую сеть [Schvaneveldt, Durso, Dearholt, 1985]. Дуги могут быть либо ориентированными (несимметричное отношение), либо неориентированными (симметричное отношение). Оба мето­да обеспечивают сжатия больших объемов данных (в форме попарных оценок) к меньшему набору параметров; однако нацелены они на выявление разных свойств исследуемых структур. Если в алгоритме Pathfinder центром внимания являются локальные отношения между концептами, то алгоритм MDS обеспечи­вает более широкое понимание свойств метризуемого пространства концептов.

Результирующие когнитивные структуры оказались близкими для летчиков-ис­требителей с одинаковым уровнем опыта, но были различными для разных групп испытуемых. Авторы экспериментов обнаружили, что по когнитивной структуре, характерной для летчика-истребителя, можно установить, новичок он или опыт­ный пилот. Наконец, проведенный ими же анализ когнитивных структур выявил наличие концептов и отношений, общих для представлений опытного специали­ста и новичка, и, кроме того, ряд концептов и отношений, которые появились только в одном из представлений. Прямым развитием рассмотренной работы ста­ла экспертная система управления воздушным боем ACES [Goldsmith, Schvaneveldt, 1985].

Аналогичное исследование механизмов накопления опыта было проведено в об­ласти программирования на ЭВМ [Cooke, 1985]. С помощью методов шкалиро­вания было показано, что один из аспектов программистского опыта включает в себя организацию знаний соответственно замыслу программы, или семантике, а не в соответствии с синтаксисом.

Пример 5.2

Сетевое представление абстрактных понятий программирования на основе оценок связности концептов у программистов показано на рис. 5.2. Эксперимент показал, что всех программистов на основе анализа структуры семантического пространства можно разбить на три группы: новички, неопытные специалисты среднего уровня, опытные специалисты. Это заключение совпадает с результатами, полученными в работе [Гаврилова, 1984]. Кроме того, исследовалась эволюция когнитивной структуры програм­миста по мере его продвижения от новичка до опытного специалиста.

Рис. 5.2. Ассоциативная сеть структуры знаний эксперта-программиста

Интерпретация выявленных отношений (связей) между понятиями требует дополни­тельных усилий от коллектива разработчиков ЭС. Так, например, означивание дуг на рис. 5.2. потребовало дополнительного эксперимента, участникам которого была пред­ложена пара понятий и поставлена задача дать словесное описание связи между поня­тиями пары. Результаты представлены в табл. 5.1. Таким образом, ассоциативная сеть на рис. 5.2 может быть превращена в семантическую.

Таблица 5.1. Описание связи между понятиями

Связанные пары понятий

Отношение между связанной парой понятий

Подпрограмма — программа

Есть часть

Символьные данные — выход

Есть тип

Параметр — программа

Используется

Программа — выход

Производит

Сортировка — поиск

Включает в себя

Численные данные — параметр

Может быть

Функция — оператор

Есть

Функция — программа

Есть часть

Отладка — программа

Подвергается

Выход — численные данные

Состоит из

Массив — символьные данные

Может состоять из

Функция — подпрограмма

Есть

Присваивание значений — параметр

Используется для

Массив — глобальная перемена

Может быть

Массив — численные данные

Может состоять из

Повторение — сортировка

Есть часть

Программа — алгоритм

Есть выполнение

Сортировка — алгоритм

Есть

Сортировка — численные данные

Делается на

Присваивание — оператор

Есть

Все упомянутые выше методы (включая кластерный анализ) можно отнести к методам психологического шкалирования. Их основу составляют алгоритмы преобразования сложных структур данных в более понятную форму, которая предполагается психологически содержательной.

Результирующее представле­ние зависит от метода:

• кластерный анализ порождает древовидную структуру [Дюран, Оделл, 1977];

• многомерное шкалирование и факторный анализ - пространственную [Окунь, 1974; Терехина, 1986];

• алгоритм MDS - сетевую [Кук, Макдональд, 1986];

• репертуарные решетки (см. параграф 5.2 и работу [Франселла, Баннистер, 1987]) порождают конструкты или метаизмерения [Kintsch, 1974].

Формальная методология психосемантического шкалирования позволяет час­тично автоматизировать процесс структурирования знаний и получать «когни­тивный разрез» его представлений о предметной области. Методология шкалиро­вания позволяет выявлять структуры знания косвенным путем при получении ответов от экспертов на довольно простые вопросы (например, «насколько близ­ки понятия X1 и Х2» вместо «скажите, какова связь между X1 и Х2 как они влияют друг на друга»).

Почти все эксперименты позволили выявить одну закономерность. Размерность семантического пространства с повышением уровня профессионализма умень­шается. Этот вывод согласуется с известными положениями когнитивной психо­логии о том, что процесс познания сопровождается обобщением.

Построение семантического пространства обычно включает три последователь­ных шага [Петренко, 1983].

1. Выбор и применение соответствующего метода оценки семантического сход­ства. Этот шаг включает в себя эксперимент с испытуемыми, которым предла­гается оценить общность предъявляемых стимульных признаков на некото­рой шкале.

2. Построение структуры семантического пространства на основе математичес­кого анализа полученной матрицы сходства. При этом происходит уменьше­ние числа исследуемых понятий за счет обобщения и получения генерализо­ванных осей.

3. Идентификацию, интерпретацию выделенных факторных структур, кластеров или групп объектов, осей и т. д. На этом шаге необходимо найти смысловые эквиваленты, языковые «ярлыки» для выделенных структур. Здесь большое значение приобретает лингвистическое чутье и профессионализм специалис­та, проводящего исследование, и экспертов-испытуемых. Часто к интерпрета­ции привлекают группу экспертов.