
2488
.pdfтоматически передать управление другому фрейму или деактивировать себя.
– Когда осуществлять заполнение слотов – в момент вызова или позднее, по мере необходимости?
Реализация этих функций может быть возложена на присоединенные процедуры. Процедуры могут также реализовывать эвристики, направленные на поиск необходимой для заполнения слотов информации.
1.3.7. Вывод в семантических сетях
Семантическими сетями представляются знания, касающиеся атрибутов объекта. Используя отношения IS-A и PART-OF, можно вывести факт, что объект обладает определенной характеристикой или свойством. Другими словами, факт, объявляемый для вершин на верхнем уровне иерархической структуры, на основе предпосылки, говорящей о справедливости его для узлов нижнего уровня, показывает возможность вывода множества фактов с помощью отношения
IS-A.
Вывод такого типа называется наследованием свойства, а ветвь IS-A называется ветвью наследования свойства. Вершины семантической сети обычно показывают объект проблемной области, концепт, ситуацию и т.п., а дуги – отношения между ними. Большинство систем с семантическими сетями имеет унифицированную структуру применительно к факторам действия и объекта по отношению к некоторому концепту. Преимущества использования такой структуры в вершинах сети заключаются в возможности наследования ожидаемых значений и значений по умолчанию, которые являются значениями атрибута в вершине экземпляра.
Большой проблемой, характерной для семантических сетей, является наследование атрибутов между иерархическими уровнями. Другими словами, результат вывода, получаемого с помощью семантической сети, не гарантирует достоверность как логический формализм. Это обусловлено тем, что процедура вывода, по определению, не более как наследование свойств ветви IS-A. Вследствие этого требуются также способы представления данных и вывода, которые обеспечивали бы одновременно управление наследованием.
Для отражения иерархических отношений между точками соприкосновения концептов, а также для установления связей между узла-
41
ми, показывающими концепты и их экземпляры, используются отношения IS-A. Для четкого разграничения вершин-концептов и вершинэкземпляров используются связи типа INSTANCE-JF, что позволяет обойти трудность, связанную с наследованием. В целях введения единой семантики в семантической сети используют процедурные семантические сети. В этом случае сеть строится на основе класса (понятия), а вершины, дуги (отношения) и процедуры представлены как объекты.
Процедурами определяются следующие основные действия над дугами (связями):
–установление связи;
–аннулирование связи;
–подсчет числа вершин, соединенных заданной дугой;
–проверканаличия-отсутствиясвязимежду заданными вершинами. Существуют также процедуры, определяющие основные дейст-
вия над вершинами, например:
определение экземпляра класса;
аннулирование экземпляра;
подсчет числа экземпляров, принадлежащих к классу;
проверка принадлежности экземпляра к некоторому классу. Благодаря этим процедурам семантическими сетями можно пред-
ставлять процедурные знания.
Особенность семантической сети (которая в то же время является
еенедостатком) заключается в целостности системы, выполненной на
ееоснове, не позволяющей разделить БЗ и механизм вывода. Обычно интерпретация семантической сети определяется с помощью использующих ее процедур. Эти процедуры основаны на нескольких способах, но наиболее типичный из них – это способ сопоставления частей сетевой структуры. Он основан на построении подсети, соответствующей вопросу, и сопоставлении ее с базой знаний сети. При этом для исчерпывающего сопоставления с БЗ вершинам переменных подсети присваиваются гипотетические значения.
Факты, в явном виде не содержащиеся в системе, могут быть выведены из других знаний. Выводы в семантических сетях отличаются значительной полнотой, они, скорее, сравнимы с нестандартными выводами процедурного представления и имеют ясную концептуальную интерпретацию. Последовательное применение подобных правил вывода может привести к образованию так называемых «цепочек выво-
42
да», которые в отдельных случаях могут достигать значительной длины.
Особый тип генерации вывода, используемый в семантических сетях, это так называемый метод распространяющейся активности и техники пересечений. Этот метод играет важную роль в обработке контекстов. Процесс осуществляется построением цепочек выводов на основе введенных высказываний во всех направлениях до тех пор, пока не обнаружится пересечение где-либо в сети.
Эти методы подобны тем, что используются в системах представления знаний на базе логики предикатов: расширение семантических сетей за счет введения в них знаний о применении, тематическая структуризация, предметно-ориентированная иерархия, разработка глобальных схем представления, в которых использовались бы семантические сети, содержащие локальные знания.
1.3.8. Вероятностный вывод
Одной из общих характеристик информации, доступной ЛПР, является ее несовершенство. Информация может быть неполной, противоречивой, неопределенной, ненадежной, нечеткой, носить случайный характер или может характеризоваться различными комбинациями этих описаний. Другими словами, информация часто является не вполне подходящей для решения задачи. Однако эксперт справляется с этими недостатками и обычно может делать верные суждения и принимать правильные решения. Интеллектуальная СППР также должна быть в состоянии справляться с неопределенностью и приходить к обоснованным выводам.
В основном определяют четыре источника неопределенных знаний в интеллектуальных СППР: неизвестные данные, неточный язык, неявное смысловое содержание и трудности, связанные с сочетанием взглядов различных экспертов. Интеллектуальные СППР должны быть в состоянии управлять неопределенностью, т.к. любая предметная область реального мира содержит неточные знания и нужно справляться с неполными, противоречивыми или даже отсутствующими данными. Были разработаны различные методы для работы с неопределенностью, наиболее известные из них: байесовское вероятностное рассуждение и его расширения и теория уверенности.
Случайная (или вероятностная) неопределенность может быть связана со случайностью событий, например, экономических ситуа-
43

ций, состояний объекта, случайным характером отказов оборудования
идругими факторами. При проектировании интеллектуальных СППР
иорганизации работы с БЗ уровень достоверности и надежность многих знаний, фактов, событий и данных бывает различным. Для формализации рассуждений в условиях стохастической неопределенности используются теория вероятностей и статические решения. При реализации рассуждений с учетом неопределенности для вычисления вероятности некоторой гипотезы для варианта решения возможно применение байесовского подхода.
Допустим, все правила в БЗ представлены в следующей форме: если Н истинно, тогда С истинно {с вероятностью р}.
Это правило подразумевает, что если событие Н происходит, тогда вероятность того, что событие С произойдет, равна р.
Вероятность того, что произойдет событие H, при условии, что событие C произошло, находится по формуле Байеса:
p(C | H) p(H)
p(H |C) p(C | H) p( H) p(C | H) p( H) ,
где p(С|Н) – вероятность того, что гипотеза Н является истинной, будет результатом свидетельства С; p(Н) – априорная (безусловная) вероятность того, что гипотеза Н является истинной; p(С| Н) – вероятность нахождения свидетельства С, даже когда гипотеза Н ложна; p( Н) – априорная (безусловная) вероятность того, что гипотеза Н является ложной.
В интеллектуальных СППР вероятности требуются для решения задачи, которые ставят эксперты. Эксперт определяет априорные вероятности для возможных гипотез p(Н) и p( Н), а также условные вероятности для наблюдаемого свидетельства С, если гипотеза Н истинна, p(С|Н), и если гипотеза Н ложна, p(С| Н). Пользователи обеспечивают информацию о наблюдаемом свидетельстве, интеллектуальная система вычисляет p(С|Н) для гипотезы Н в свете представленного пользователем свидетельства С. Вероятность p(С|Н) называется апостериорной вероятностью гипотезы Н при наблюдаемом свидетельстве С.
Рассмотрим ситуации, когда эксперт, основываясь на простом свидетельстве С, не может выбрать простую гипотезу, но скорее обеспечивает многочисленные гипотезы Н1, Н2,…, НТ. Или когда имеются многочисленные свидетельства С1, С2, …, Сn и эксперт так-
44

же выдает множество гипотез.
Предположим, что эксперт, имея три условно независимых свидетельства С1, С2 и С3, создает три взаимно исключающие гипотезы Н1, Н2 и Н3 и обеспечивает априорные вероятности для этих гипотез – p(Н1), p(Н2) и p(Н3) соответственно. Эксперт также определяет условные вероятности каждого отмеченного свидетельства для всех возможных гипотез. В табл. 1 показаны априорные и условные вероятности, обеспеченные экспертом.
Таблица 1
Априорные и условные вероятности
Вероятности |
|
Гипотезы |
|
|
i=1 |
i=2 |
|
i=3 |
|
|
|
|||
P(Hi) |
0,4 |
0,35 |
|
0,25 |
P(C1|Hi) |
0,3 |
0,8 |
|
0,5 |
P(C2|Hi) |
0,9 |
0,0 |
|
0,7 |
P(C3|Hi) |
0,6 |
0,7 |
|
0,9 |
Допустим, что мы сначала наблюдаем свидетельство С3. Интеллектуальная система вычисляет апостериорные вероятности для всех гипотез:
p(Hi |C3) 3p(C3 | Hi) p(Hi) ,i 1,2,3.
p(E3 | Hi) p(Hk )
k 1
Таким образом,
p(H1 |C3) |
|
0,6 0,4 |
0,34; |
|||
0,6 0,4 0,7 0,35 0,9 0,25 |
|
|
|
|||
p(H2 |C3) |
|
0,7 0,35 |
|
0,34; |
||
|
0,6 0,4 0,7 0,35 0,9 0,25 |
|||||
p(H3 |C3) |
|
0,9 0,25 |
|
0,32. |
||
|
0,6 0,4 0,7 0,35 0,9 0,25 |
Как можно видеть, после того, как наблюдается свидетельство С3, доверие гипотезе Н2 становится равным доверию гипотезе Н1. Доверие гипотезе Н3 также возрастает и даже приблизительно достигает доверия гипотезам Н1 и Н2.
Предположим теперь, что мы наблюдаем свидетельство С1. Апо-
45

стериорные вероятности рассчитываются по уравнению
p(Hi |C1C3) 3p(C1 | Hi) p(C3 | Hi) p(Hi) ,i 1,2,3.
p(C1 | Hi ) p(C3 | Hi) p(Hk )
k 1
Таким образом,
P(Hi |C1C3) |
|
0,3 0,6 0,4 |
|
0,19; |
0,3 0,6 0,4 0,8 0,7 0,35 0,5 0,9 0,25 |
||||
P(H2 |C1C3) |
|
0,8 0,7 0,35 |
0,52; |
|
|
0,3 0,6 0,4 0,8 0,7 0,35 0,5 0,9 0,25 |
|||
P(H3 |C1C3) |
|
0,5 0,9 0,25 |
0,29. |
|
|
0,3 0,6 0,4 0,8 0,7 0,35 0,5 0,9 0,25 |
Гипотеза Н2 теперь рассматривается как наиболее вероятная, т.к. доверие гипотезе Н1 резко уменьшается.
После наблюдения свидетельства С2 вычисляются последние апостериорные вероятности для всех гипотез:
p(Hi |C1C2C3) |
p(C1 | Hi) p(C2 | Hi ) p(C3 | Hi ) p(Hi) |
,i 1,2,3. |
|||||||
3 |
|||||||||
|
|
|
p(E1 | Hi) p(C2 | Hi) p(C3 | Hi) p(Hk ) |
|
|
|
|
|
|
|
|
|
k 1 |
|
|
|
|
|
|
Таким образом, |
|
|
|
|
|
|
|||
p(Hi |C1C2C3) |
|
|
0,3 0,9 0,6 0,4 |
|
|
|
|
0,45; |
|
0,9 0,3 0,6 0,4 0,8 0,0 0,7 0,35 0,5 0,7 0,9 0,25 |
|||||||||
p(H2 |C1C2C3) |
|
|
0,8 0,0 0,7 0,35 |
|
|
|
|
|
0; |
|
0,3 0,9 0,6 0,4 0,8 0,0 0,7 0,35 0,5 0,7 0,9 0,25 |
||||||||
p(H3 |C1C2C3) |
|
|
0,5 0,7 0,9 0,25 |
|
|
|
|
|
0,55. |
|
0,3 0,9 0,6 0,4 0,8 0,0 0,7 0,35 0,5 0,7 0,9 0,25 |
|
Хотя первоначальное ранжирование, предложенное экспертом, было Н1, Н2 и Н3, только гипотезы Н1 и Н3 остались для рассмотрения после всех свидетельств (С1, С2 и С3), которые наблюдались. Гипотеза Н2 теперь может быть полностью исключена. Гипотеза Н3 теперь рассматривается как более предпочтительная, чем гипотеза Н1. При реализации байесовского подхода возникают некоторые проблемы: необходимость заранее устанавливать априорные вероятности каждого свидетельства, а также проблема, связанная с представлением ненадежности байесовской вероятностью, зависящей от субъективного
46
мнения человека. Эта вероятность не позволяет эффективно описать незнание. Другими словами, для байесовской вероятности требуется соотношение p(А)+p( А)=1, поэтому нельзя отделить отсутствие доверия от недоверия. И то и другое выражается через p(А).
Для представления субъектной ненадежности, которую не способна выразить байесовская вероятность, была введена теория вероятностей Демпстера-Шафера, отличающаяся тем, что она не фиксирует значения вероятности, а может представлять и незнание. Демпстер предложил такие понятия, как нижняя и верхняя вероятности. Шафер, совершенствуя теорию Демпстера, переименовал их соответственно в функцию доверия и меру правдоподобия с целью придания этим понятиям субъективного смысла.
Теория свидетельств Демпстера-Шафера является хорошо известной процедурой рассуждений c неопределенностью в ИИ. Она может рассматриваться как расширение байесовского подхода. Этот подход вводит различия между неопределенностью и незнанием путем создания функций доверия. Функции доверия позволяют нам использовать наши знания при ограниченной возможности присвоения вероятностей. Подход Демпстера-Шафера особенно релевантен для объединения экспертных мнений, т.к. эксперты различаются в своих мнениях с определенной степенью незнания. Подход может быть использован для обращения с эпистимиологической информацией (которая конструируется из неясных восприятий) так же, как с незнанием или недостатком информации.
1.3.9. Вывод на основе теории уверенности
Теория уверенности (или теория коэффициентов уверенности) является известной альтернативой байесовскому рассуждению. Основные принципы этой теории были предложены Бухананом и Шортлиффом еще в 1975 г., а позже основательно разработаны ими для диагностики и терапии инфекций крови. Стандартные статистические методы основываются на допущении, что неопределенность является вероятностью того, что событие (или факт) истинно или ложно. В теории уверенности, так же, как и в нечеткой логике, неопределенность представлена как степень уверенности. Существуют две стадии в каждом невероятностном методе неопределенности. Первая: необходимо иметь возможность выразить степень уверенности. Вторая: необходимо манипулировать (например, объединять) степени уверен-
47
ности в процессе использования системы, основанной на знаниях. Теория уверенности полагается на использование коэффициентов
уверенности. Коэффициенты уверенности (КУ) выражают доверие событию (факту или гипотезе), основанное на свидетельстве (или оценке эксперта). Существует несколько методов использования коэффициентов уверенности для обращения с неопределенностью в интеллектуальных системах.
Теория уверенности предлагает понятия доверия и недоверия. Эти понятия являются независимыми друг от друга и таким образом не могут быть объединены тем же путем, как вероятности, но они могут быть объединены в соответствии со следующей формулой:
КУ(В,С)=МД(В,С) – МН(В,С),
где КУ – коэффициент уверенности; МД – мера доверия; МН – мера недоверия; В – вероятность; С – свидетельство или событие.
Другим допущением теории уверенности является то, что содержание знаний в правилах намного важнее, чем алгебра мер доверий, которая удерживает систему в целостном виде. Меры доверия соответствуют оценкам информации, которые эксперты прилагают к своим заключениям. Коэффициенты уверенности могут быть использованы при объединении различных оценок экспертов.
1.4.Экспертные системы
1.4.1.Основные понятия
Экспертная система – это система, которая использует человеческие знания, встраиваемые в компьютер, для решения задач, которые обычно требуют человеческой экспертизы. Хорошо разработанные системы имитируют процесс рассуждения экспертов, используя это для решения специфических задач.
Такие системы могут использоваться неэкспертом для улучшения его способностей и возможностей в решении задач определенного класса в конкретной предметной области. ЭС могут быть использованы также для распространения источников редких знаний. В конечном счете такие системы могут функционировать лучше, чем некоторые отдельные эксперты-люди при выработке решения или суждения в специфической, обычно узкой области экспертизы.
Технологию построения ЭС часто называют инженерией знаний. Этот процесс требует специфической формы взаимодействия созда-
48
теля ЭС, которого называют инженером знаний, и одного или нескольких экспертов в некоторой предметной области. Инженер знаний «извлекает» из экспертов процедуры, стратегии, эмпирические правила, которые они используют при решении задач, и встраивает эти знания в ЭС.
Основные понятия ЭС: экспертиза, эксперты, проведение экспертизы, вывод и объяснительные способности.
Экспертиза – это обширное, специфическое знание для решения задачи, извлеченное из обучения, чтения и опыта. Следующие типы знаний являются примерами того, что включает в себя экспертиза:
-теории о проблемной области;
-правила и процедуры относительно проблемной области;
-правила (эвристики) о том, что делать в данной проблемной ситуации;
-глобальные стратегии для решения таких типов задач;
-метазнания (знания о знаниях);
-факты о проблемной области.
Эти типы знаний дают возможность ЛПР принимать решения лучше и быстрее при решении сложных задач.
Эксперты. Трудно дать определение понятию эксперт, т.к. мы в действительности говорим о разных степенях или уровнях экспертизы. Вопросом является также, каким объемом экспертных знаний в данной области и какими навыками должен обладать человек, чтобы быть квалифицированным в качестве эксперта?
Обычно человеческая экспертиза включает многогранное интеллектуальное поведение, которое вовлекает в процесс следующие виды деятельности:
выявление и формулировка проблемы и задачи;
решение задачи быстро и надлежащим образом;
объяснение решения;
обучение из опыта;
реструктуризация знаний;
отступление при необходимости от устоявшихся правил
ишаблонов;
определение уместности и соответствия;
осознание ограничений.
Для имитации эксперта-человека необходимо создать компьютерную систему, проявляющую все эти характеристики. Однако в современных ЭС, прежде всего, исследованы и разработаны решение
49
задач и объяснение решений.
Проведение экспертизы. Целью ЭС является проведение экспертизы путем аккумуляции знаний от экспертов и предоставление их другим людям. В этот процесс вовлечены четыре вида деятельности: извлечение знаний (из экспертов или других источников), представление знаний (в компьютере), вывод знаний и передача знаний пользователю. Знания хранятся в компьютере в базе знаний (БЗ).
Вывод. Уникальной чертой ЭС является их способность рассуждать. Имеется в виду, что необходимые знания для экспертизы хранятся в БЗ, программа может иметь доступ к соответствующим данным в БД, а ЭС может делать логический вывод, получая нужное знание, зачастую не хранящееся в явном виде в БЗ. Процесс вывода осуществляется составляющей системы, которая называется машиной вывода.
Способность объяснять. Другой уникальной чертой ЭС является ее способность объяснять свои советы или рекомендации. Объяснение и обоснование производятся подсистемой объяснений. Она дает возможность системе проверять свои рассуждения и объяснять их действия.
Экспертные системы целесообразно использовать, когда:
–разработка ЭС возможна, а именно существуют эксперты в данной области, которые сходятся в оценке предлагаемого решения, умеют выразить на естественном языке и объяснить используемые методы; когда задача требует только рассуждений, а не действий, не является слишком трудной, т.е. ее решение должно занимать у эксперта до нескольких часов или дней, а не недель или месяцев, задача должна относиться к достаточно структурированной области, а решение не должно использовать в значительной мере здравый смысл;
–разработка ЭС оправдана, если решение задачи принесет значительный эффект; если использовать человека-эксперта невозможно из-за ограниченного количества экспертов или из-за необходимости выполнения экспертизы одновременно во многих местах; если при передаче информации происходит значительная потеря времени или информации; если необходимо решать задачу в окружении, враждебном человеку;
–методы инженерии знаний соответствуют задаче, если задача обладает следующими характеристиками: может быть естественным
50