Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Петрова / Учебное пособие ТЭС.doc
Скачиваний:
314
Добавлен:
09.02.2015
Размер:
7.29 Mб
Скачать

4. Структурирование и формализация знаний.

4.1. Методология структурирования знаний.

Обратимся к рисунку 2.5, рассмотренному нами в разделе 2.

Поле знаний мы определили, как условное описание основных взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта.

Поле знаний формируется на третьей стадии разработки ЭС. Поле знаний - это первый шаг к формализации знаний и представляет собой модель знаний о предметной области.

Обобщенную структуру поля знаний можно представить в виде следующего выражения

PZ = < X , Y , M >

В выражении X - это структура исходных данных, которая подлежит интерпретации и обработке средствами ЭС; Y - структура результата, который выдает система; M – операционная модель предметной области, в которой происходит преобразование X в Y.

Операционная модель предметной области складывается из двух составляющих

M = < Z , G >

где Z - знания эксперта о методах принятия решений в данной предметной области, в которые входят некоторые понятия, обобщаюшие объекты отдельных классов по их специфическим признакам (концепты) B, отнощения между ними RB и стратегия манипулирования ими для нахождения решения S; G - структурированное описание реальной предметной области с ее объектами A и отношениями между ними RA.

Таким образом,

Z = < B , RB , S >

G = < A , RA >

Окончательно получим структуру операционной модели в виде

M = < A ,RA , B , RB , S >

в которой сплетаются реально существующий объективный мир предметной области G с его объектами A (люди, оборудование и т.д.) и отнощениями RA (технолог, конструктор, технологическая операция - технологический переход, причина - следствие и т.д.) и субъективный мир Z с его понятиями B (производительность, надежность, технологичность и т.д.) и отношениями RB (лучше-хуже, экономичнее, производительнее, подходит - не подходит и т.д.), на основании которых работают концепция принятия решений S (стратегическая составляющая поля знаний), рис.4.1.

Рис.4.1

Динамику и активность полю знаний придает компонент S, который порождает действия над элементами поля, осуществляющие преобразования условий X в результат Y.

При разработке поля знаний перед инженером по знаниям встает множество вопросов, среди которых три главных: что делать в данный момент, как реализовать то, что хочешь делать, почему именно это надо делать.

Рассмотрим последовательность стадий проведения концептуального анализа знаний, отвечающую на первый вопрос (рис.4.2).

Рис.4.2

Определение входных и выходных данных. Этот шаг совершенно необходим , так как он определяет направление движения в поле знаний от X к Y.

Структура входных и выходных данных существенно влияет на форму и содержание поля знаний. На этом шаге определение может быть достаточно размытым, в дальнейшем оно будет уточняться.

Составление словаря терминов. На этом шаге проводится текстуальный анализ всех протоколов сеансов извлечения знаний и выписываются все значимые термины, обозначающие понятия, явления, процессы, действия, признаки и т.п. Словарь должен быть осмысленным.

Выявление объектов, понятий и атрибутов. Здесь проводится выбор значимых для принятия решений понятий и признаков. На этом этапе образуется полный систематичекий набор терминов из технологической предметной области.

Выявление связей между понятиями. На данном шаге строится сеть ассоциаций, но отношения еще не поименованы а только намечены (технологический процесс, операция, оборудование, производительность, экономичность и т.п.)

Выявление метапонятий и детализация понятий. Связи, полученные на предыдущем шаге, позволяют инженеру по знаниям структурировать понятия и выявлять понятия более высокого уровня обобщения (метапонятия) или детализировать их на более низком уровне.

Построение пирамиды знаний. Под пирамидой знаний мы понимаем иерархическую структуру понятий, передвижение по которой позволяет более или менее углубленно понимать уровень абстракции понятий. Количество уровней в пирамиде зависит от особенностей предметной области, профессионализма эксперта и инженера по знаниям.

Определение отношений. Отношения RA и RB между понятиями выявляются как внутри каждого из уровней, так и между уровнями. Фактически здесь присваиваются имена понятиям, выявленным на 4 и 5 шагах, а также обозначают причинно-следственные, лингвистические, временные и другие виды отношений.

Определение стратегии принятия решений. Это выявление цепочек рассуждений, связывающих все сформированные ранее понятия и отношения в динамическую стратегии принятия систему поля знаний. Именно стратегии ( S ) придают активность знаниям, осуществляя манипуляции с моделью M в поиске пути от Х к У.

Среди методов структурирования знаний необходимо рассмотреть методы, приведенные на рисунке 4.3.

Рис.4.3

Введем некоторые определения. Понятие - это обобщение предметов некоторого класса по их специфическим признакам. Обобщенность является сквозной характеристикой всех структур, начиная с простейших образов.

Так понятие ТЕХНОЛОГИЧЕСКИЙ ПРОЦЕСС объединяет множество терминов: ТЕХНОЛОГИЧЕСКАЯ ОПЕРАЦИЯ, ТЕХНОЛОГИЧЕСКИЙ ПЕРЕХОД, ОБОРУДОВАНИЕ и т.д.

Все методы выявления понятий можно разделить на две разновидности (рис. 4.4).

Рис.4.4

Традиционные методы основаны на математическом аппарате распознавания образов и классификации.

Нетрадиционные методы используют методологию инженерии знаний. Эти методы широко описаны в соответствующей литературе. Отметим только общие рекомендации. В качестве категории терминов целесообразно вводить следующие: объяснение, общие правила, режимные правила, понятия, процедуры, факты и прочие понятия.

Понятия не существуют независимо, они включены в общую понятийную структуру с помощью отношений. То, что знания в памяти - это некоторые связанные структуры, а не отдельные фрагменты, общеизвестно и очевидно. В моделях представления знаний для описания структуры, как правило используются причинно-следственные связи.

В последних работах по ИИ уделяется большое внимание взаимосвязанности выявления связей структур (рис. 4.6), путем введения "сценария". Сценарии делятся на фрагменты и сцены. Связи между фрагментами - временные или пространственные, внутри фрагмента - ситуативные, ассоциативные, функциональные и т.д.

Рис.4.6

К формальным методам можно отнести метод многомерного шкалирования.

Неформальные методы выявления связей можно разделить на следующие:

  • метод сортировки карточек;

  • метод построения замкнутых кривых.

Эти методы основаны на выявлении у эксперта явных и неявных связей между понятиями.

После того как определены связи между понятиями, все понятия как бы распадаются на группы, которые и представляют собой метапонятия, поименование которых происходит на следующей стадии структурирования.

Процесс образования метапонятий, т.е. интерпретации групп понятий можно проиллюстрировать рисунком 4.7:

Рис.4.7

Такая иерархическая понятийная структура получила название - "пирамида знаний". В пирамиде знаний каждый следующий уровень служит для восхождения на новую ступень обобщения и углубления знаний.

Рассмотрите примеры, приведенные на рисунке 4.8:

Рис. 4.8

Если рассматривать более углубленно знания о предметной области, то пирамиду знаний можно было бы расчленить на структуры более низкого порядка, приведенные на рисунке 4.9.

Рис. 4.9

Подобных структурных схем можно представить достаточно много, в зависимости от желаемой глубины представления знаний. Попытаемся дать математическую интерпретацию уровней пирамиды знаний:

U = { U1 , U2 , U3 , U4 , U5 , ....}

Если Е некоторая система с основными понятиями OJ и основными отношениями RJ, то отображением Е в однотипную ей систему E1 в предметной области Ф будет:

Ф : Е -- Е1

Методы построения пирамиды знаний обязательно включают использование наглядного материала: рисунки и структурные схемы. Уровни пирамиды чаще возникают в сознании инженера по знаниям именно как некоторые наглядные образы.

Существует более 200 видов различных отношений, в литературе предложены различные классификации отношений. Следует только подчеркнуть, что помимо универсальных отношений (пространственных, временных, причинно-следственных) существуют еще и специфические отношения, характерные предметной области.

Методология структурирования опирается на современные представления о структуре человеческой памяти и формах представления (репрезентации) информации в ней. Скудность методов структурирования объясняется тем, что методологическая база инженерии знаний только закладывается, а большинство инженеров по знаниям проводит концептуализацию, руководствуясь наиболее дорогими и неэффективными способами - "проб и ошибок" и "по наитию", т.е. исходя из соображений здравого смысла.

Если попытать представить, как организована память, то крупными блоками выделены глобальные понятия, а уровни вложения отражают различные уровни репрезентации понятий и семантических отношений (рис.4.10).