Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции.doc
Скачиваний:
179
Добавлен:
28.06.2014
Размер:
1.1 Mб
Скачать

1.3 Не-факторы знания

В идеале было бы замечательно, если БЗ интеллектуальной системы содержала бы только аналитические утверждения, обоснование которых не требуется. К сожалению, данные и знание, описывающие сущности и связи какой-либо проблемной области, как правило, неполны, противоречивы, немонотонны, неточны, неопределенны и нечетки. Остановимся на этих особенностях знания.

В классических логических системах свойство полнотыобычно формулируется следующим образом: для множества формул с заданными свойствами исходная система аксиом и правил вывода должна обеспечить вывод всех формул, входящих в это множество. Важно также свойствонепротиворечивости, суть которого сводится к тому, что исходная система аксиом и правил вывода не должна давать возможность выводить формулы, не принадлежащие заданному множеству формул с выбранными свойствами.

Например, полные системы аксиом и правил вывода в классическом исчислении предикатов первого порядка позволяют получить любую общезначимую формулу из множества общезначимых формул и не дают возможности получить какие-либо формулы, не обладающие этим свойством.

Однако на практике трудность получения полной и непротиворечивой БЗ состоит в том, что знания о некой конкретной проблемной области, как правило, плохо формализованы или не формализованы совсем, а значит трудно сформулировать или даже невозможно сформулировать и те априорные свойства, которым должны удовлетворять формулы, выводимые в данной системе.

От полноты содержащейся в БЗ информации зависит и полнота ответов на запросы, предъявляемые к БЗ. Если в БЗ, содержащую сведения о студентах и преподавателях данного университета, поступил запрос «Бурлаков – профессор?», то ответ будет положительным, если это на самом деле так. В случае неудачи с этим запросом могут быть два варианта: а) Бурлаков – не профессор и б)  статус Бурлакова не известен. Первый вариант имеет место, если мы придерживаемся предположения о замкнутости мира(Рейтер), рассматривающего факты, которые не могут быть найдены (выведены) в БЗ, как их отрицания. О втором варианте трудно что-либо сказать. Таким образом, если в БЗ содержатся сведения только о нескольких преподавателях университета, хотя их на самом деле намного больше, то, естественно, такая неполная БЗ и будет давать

ответы только об этих преподавателях, и может быть возможен случай, когда система знает о других, неизвестных ей преподавателях. Можно отметить, что проблеме обработки запросов при неполноте знаний посвящена логика вопросов и ответов (эротетическая логика), в которой наряду с обычными истинностными значениями {И, Л} добавлены еще два: «неизвестно» и «противоречиво».

Что касается противоречивостизнания, то ее последствия в силу потери разницы между истиной и ложью (вспомним, что из противоречия выводима любая формула (exfalsoquodlibet), т.е. А,А ├ В) поистине катастрофически. При представлении и обработке противоречивых знаний возникают две проблемы. Первая касаетсяассимиляции(усвоения) противоречивой информации, т.е. способности включать противоречия в БЗ и возможности работать с противоречивой БЗ. Вторая проблема заключается ваккомодации(приспособлении) противоречивого знания, т.е. такой модификации БЗ, при которой она становится непротиворечивой. Эти две проблемы тесно связаны между собой и от их совместного решения зависит общая проблема вывода утверждений в противоречивой БЗ.

На первый взгляд, исходя из здравого смысла, проблема ассимиляциипротиворечий может быть разрешена путем введенияпорядкареализации вывода, т.е. сначала пытаются вывести рассуждения, связанные с частными фактами, нежели с общими законами. Рассмотрим следующую БЗ.

  1. Студенты изучают биологию или х(Ст(х)Биол(х)), предполагая, чтовсестуденты изучают биологию.

  2. Рыбин – студент или Ст(Рыбин). Отсюда следует, что студент Рыбин изучает биологию.

Однако, введение в эту БЗ дополнительной информации типа:

  1. Студенты радиотехнического факультета не изучают биологию или х (СтРад(х)Биол(х));

  2. Рыбин – студент радиотехнического факультета или СтРад(Рыбин), которая носит более частный и уточняющий характер, блокирует предыдущий вывод, отдавая предпочтение этим частным утверждениям. Отсюда выводимо, что студент Рыбин не изучает биологию.

Трудность нахождения порядка реализации вывода заключается, конечно, в семантикеутверждений, которая в общем случае неочевидна. Можно говорить, что утверждение В выводимо из гипотез А1, А2, …,An(или А1, А2, …,An ├ В), если каждая гипотезарелевантнаэтому утверждению. Но построение такой релевантной логики связано с большими трудностями. Здесь можно найти связь сситуационной семантикой, где выводы делаются только в пределах той ситуации, которая имеет место в данный момент. Естественно, при переходе к другой ситуации имеет месторевизияБЗ и выведенные ранее утверждения не должны использоваться для вывода новых.

Проблема ассимиляции противоречия имеет место и в уже упоминавшейся эротетической логике. Если, например, из одного источника получено, что Студент(Петров) истинно, а из другого – Студент(Петров) истинно, то в этой логике данному утверждению будет приписано истинностное значение «противоречиво», что дает возможность работать с противоречивой информацией.

Что касается аккомодациипротиворечия, то проблема заключается в обработке так называемых «подозрительных» формул (т.е. формул, которые могли бы быть противоречивыми) в качестве гипотез. Так как эти формулы находятся среди формул, общезначимость которых не вызывает сомнений, то тут возникают вопросы установления непротиворечивости «подозрительных» формул, нахождения и описания множества формул, выдвигаемых в качестве гипотез, и наконец, каким образом эти гипотезы могут взаимодействовать с другими утверждениями для дедуктивного вывода новых утверждений.

Конечно, поддержка истинности таких утверждений должна проверяться исключениями, которые имеют место в реальной БЗ, что приводит к ее ревизии и усложняет саму процедуру вывода.

В классической логике предикатов первого порядка отношение выводимости удовлетворяет следующим свойствам:

  1. рефлексивности: А1, А2, …,An ├Ai,i = , т.е. вывод заключения, идентичного одной из посылок, есть общезначимая операция;

  2. транзитивности: если А1, А2, …,An ├ В1и А1, А2, …,An, В1 ├ В2, то А1, А2, …,An ├ В2, т.е. промежуточные результаты можно использовать для вывода заключения В2;

  3. монотонности: если А1, А2, …,An ├ В1, то А1, А2, …,An, {F} ├ В1, где {F} – множество добавочных утверждений, т.е. добавочно введенные утверждения не отменяют ранее выведенное утверждение В1.

К сожалению, свойство монотонности не выполняется для динамических проблемных областей, БЗ которых содержит неполную, неточную и динамически изменяющуюся информацию. Рассуждения в таких БЗ, говорят, часто предположительны, правдоподобны и должны подвергаться пересмотру. Довольно очевидно, что для таких пересматриваемых рассуждений логическая система должна быть немонотонной. Это значит, что пересматриваемые рассуждения не являются в классическом смысле общезначимыми, и если заключение В выводимо из посылок А1, А2, …,An, существует модель для {А1, А2, …,An}{F}, не подтверждающая В.

Например, «Петров юн» не является общезначимым следствием из двух посылок: «Большинство студентов юны» и «Петров – студент». Оно просто выполнимо с этими посылками. И, следовательно, это заключение принадлежит к возможно выполнимому на основе этих двух посылок образу мира.

Конечно, если у нас нет дополнительной информации, то мы по умолчаниюполагаем: «Если Вы не знаете ничего другого, то предположите, что все студенты действительно юны». Тогда унаследовав это свойство, можно вывести, что и Петров, будучи студентом, также юн.

При поступлении новой информации предположения могут стать невыполни­мы­ми с новым множеством посылок и будут отвергнуты. Узнав, например, что Петров не юн, и получив, таким образом, противоречивую БЗ, мы или отвергнем ранее выведенное заключение, или потребуем дополнительной информации.

Такой тип немонотонных рассуждений был реализован в логике умолчанийи будет рассмотрен наряду с другими типами немонотонных логик позднее.

Отметим только, что проблема немонотонности тесно связана с проблемами неполноты и противоречивости знаний.

При описании динамически изменяющегося реального мира мы часто имеем дело с неточнойинформацией, которая будучи помещенной в БЗ обрабатывается как истинная информация, хотя это не соответствует действительности. Например, пусть в БЗ хранятся следующие сведения:

Студент(Петров),

Читать_курс(Фролов, Математическая логика).

Однако эти сведения могут не соответствовать действительности, если студент Петров месяц назад был отчислен из университета, а Фролов уже читает другой курс.

Неточностьотносится ксодержаниюинформации (или значению сущности) и наряду с неполнотой и противоречивостью должна обязательно учитываться при представлении знаний в БЗ. Неточная информация может быть как непротиворечивой, так и противоречивой. Так, например, возраст студента Петрова, записанный в БЗ, равен 32 годам, хотя ему на самом деле 23. Это пример непротиворечивой, хотя и неточной информации. Может быть и другая ситуация, когда по ошибке в БЗ ему записали 123 года, что противоречит действительности, так как возраст людей, как правило, колеблется от 0 до 100 лет.

Для того чтобы неточные данные стали точными, можно воспользоваться ранее упоминавшимся модальным оператором K, который подчеркивает, что если известно, что некоторое утверждение истинно, то оно на самом деле истинно. Например, если известно, что все находящиеся в БЗ личности являются студентами, то это на самом деле так, илих(KСтудент(х)Студент(х)).

К неточности будем относить также величины, значения которых могут быть получены с ограниченной точностью, не превышающей некоторых порог, определенный природой соответствующих параметров. Очевидно, что практически все реальные оценки являются неточными, и сама оценка неточности также является неточной. Примеры неточности данных встречаются при измерении физических величин. В зависимости от степени точности измерительного прибора, от психического состояния и здоровья человека, производящего измерения, получаемое значение величины колеблется в некотором интервале. Поэтому для представления неточности данных мы можем использовать интервал значений вместе с оценкой точности в качестве меры доверия к каждому значению.

Если неточность относится к содержанию информации, то неопределенность– к ее истинности, понимаемой в смысле соответствия реальной действительности (степени уверенности знания). Каждый факт реального мира связан с определенностью информации, которая указывает на степень этой уверенности.

Понятия «определенности» и «уверенности» довольно трудно формализуемы, и для их определения чаще всего используются количественные меры. Основная идея такой меры заключается во введениифункции неопределенностиunc(p), понимаемой как определенность того, что высказываниеp, содержащееся в БЗ, истинно, т.е. говорят, что утверждениеpболее определенно, чемq, еслиunc(p)  unc(q).

Традиционным подходом для представления неопределенности является теория вероятностей – хорошо разработанная на сегодняшний день математическая теория с ясными и общепринятыми аксиомами.

Пусть – конечное множество утверждений, замкнутое относительно отрицания и конъюнкции (т.е. любая суперпозиция функций из множестваснова принадлежит), аиобозначают противоречивое и общезначимое утверждения соответственно в множестве. Тогдавероятностная мераP, определенная на, представляет собой определенность (вероятность, правдоподобность, уверенность) утверждения такую, что

  1. P() = 0;

  2. P() = 1;

  3. P(pq) =P(p) +P(q), еслиp & q=.

Однако классическая теория вероятностей страдает рядом недостатков и до сих пор не утихают споры насчет того, какого рода действительность хотят выразить с помощью этой теории. Например, как найти вероятностную меру Pдля конкретного множества утверждений или на основании чего должно выполняться равенствоP(q) + P(q) = 1. Действительно, если БЗ конкретно неизвестно, является ли Петров студентом или нет, то почемуP(Студент(Петров)) +P(Студент(Петров)) = 1?

Основной вопрос, возникающий при выборе функции неопределенности для множества утверждений, заключается в нахождении ограничений этой функции теми утверждениями, которые логически или вероятностно связаны между собой. Решение этого вопроса обеспечивается правилом Байеса:

P(H | E1, E2, …, En) =

P(H)  P(E1, E2, …, En | H)

P(E1, E2, …, En)

,

где P(H | E1, E2, …, En) – условная вероятность утверждения Н при условииE1, E2, …, En, т.е. это вероятность того, что утверждение Н истинно, если истинны утверждения (события)E1, E2, …, En. Однако на практике определить вероятность того, что утвержденияE1, E2, …, Enистинны и условную вероятностьP(E1, E2, …, En | H) довольно трудно. Конечно, можно упростить проблему и считать, что утвержденияEiстатистически независимы, т.е.P(E1, E2, …, En) =P(E1)P(E2)…P(En). Однако, насколько достоверно и обоснованно предположение о статистической независимостиEi– это вопрос, требующий дополнительного анализа для каждого конкретного случая. Другое упрощение касается статистической независимости утверждениеEiпри условии Н, т.е.P(E1, E2, …, En | H) =P(E1 | H)P(E2 | H)…P(En | H).

В теории Демпстера-Шейфератребование к условиюP(q) + P(q) = 1 ослаблено и вместо него имеет местоP(q) + P(q)  1. Здесь основным средством для распределения и манипулирования степенями уверенности утверждений является функциявероятностной мерыMr, представляющая собой распределение базовых вероятностей на все возможные утверждения. Исходя из этого распределения,поддержкаутверждениюpопределяется какsup(p) = Mr(q), если {q  p}, т.е. вероятностная мера любого утвержденияq, из которого следует р, кладется в общую копилку для р.

Правдоподобностьутверждения р определяется следующим образом:pls(p) = 1 – sup(p). Легко показать, чтоsup(p)  pls(p). Отсюдастепень уверенностиутверждения р определяетсядоверительным интервалом:conf(p) = [sup(p), pls(p)].

Возвращаясь к примеру, являтеся ли Петров студентом или нет, мы получим доверительный интервал [0, 0], если в БЗ нет никаких сведений о студенте Петрове, иconf(p) = [1, 1], если Петров не является студентом.

Однако, и в подходе Демпстера-Шейфера имеются свои трудности. Так, неясно, что делать при выборе утверждений, доверительные интервалы которых перекрываются или значительно отличаются размерами.

Таким образом, и классическая теория вероятностей, и теория Демпстера-Шейфера нуждаются в обоснованиив каждом конкретном случае, когда мы имеем дело с неопределенностью. И только тщательный анализ видов неопределенности может дать ответ, какой из подходов более предпочтителен.

Наконец, остановимся на проблеме представления нечеткихзнаний, являющейся ключевой при разработке интеллектуальных систем различного назначения. Нечеткие знания по своей природе разнообразны и могут быть условно разделены на следующие категории: неточность, недоопределенность, неоднозначность, словом, любые нечеткости, между которыми нельзя провести четкой границы.

Один из способов описания нечеткости основывается на понятии нечеткого множества, введенного Л. Заде. Пусть – произвольное непустое множество.Нечетким множествоммножестваназывается множество пар: = {<A(x)/x}, гдеx  ,(x)  [0, 1].

Функция : [0, 1] называетсяфункцией принадлежностинечеткого множества, а– базовым множеством. Для каждого конкретного значенияx  величина(x) принимает значения из замкнутого интервала [0, 1], которые называютсястепенью принадлежностиэлементахнечеткому множеству.

Носителемнечеткого множестваназывается подмножество А множества, содержащее те из, для которых значения функции принадлежностиА(x) > 0.

Например, пусть – множество натуральных чисел. Тогда его нечеткое множество«очень малых» чисел может быть таким:= {<1/1>, <0.8/2>, <0.7/3>, <0.6/4>, <0.5/5>, <0.3/6>, <0.1/7>}.

Носителем нечеткого множества является множество А = {1, 2, 3, 4, 5, 6, 7}. Отметим, что носитель нечеткого множества – это обычное, «четкое» подмножество множества.

В настоящее время существует целый ряд моделей представления нечеткости в интеллектуальных системах, среди которых модель коэффициентов уверенностивMYCIN,вероятностная логикаНильсона,теория свидетельствШейфера,теория возможностейЗаде,модель голосованияБэлдвина,лингвистическая модельвMILORDи другие.

Несмотря на различную природу нечеткости, формализованную в моделях, мы можем условно разбить эти модели на три группы по типу нечетких множеств, используемых для оценок объектов (значений, функций принадлежности) в моделях.

К первой группеотносятся модели с числовым значением функции принадлежности: модель коэффициентов уверенности, вероятностная логика.

Вторая группавключает в себя интервально-значные модели: теория свидетельств, теория возможностей, модель голосования и т.д.

Третья группа– нечетко-значные модели, в частности, лингвистическая модель вMILORD.

Если не учитывать внешние проявления знаний в разных моделях, которые могут изменяться с одной модели на другую, то можно представить любое нечеткое знание в формальном виде M: Z, гдеM– некоторое нечеткое выражение, отражающее понятия, утверждения, отношения, правила и т.п., аZ– мера доверия к тому, чтоMистинно.

В моделях с числовым значением обычно Zпредставляет собой действительное число (в большинстве случаев число интервала [0, 1]) и интерпретируется как степень уверенности истинности выражения М.

Формальным аппаратом для выражения меры доверия Zв интервально-значных моделях является интервал. В различных моделях нижняя и верхняя границы интервала объясняются по разному. Они могут быть нижней и верхней вероятностями как в теории свидетельств, степенями необходимости и возможности в теории возможностей, необходимой и возможной поддержками в модели голосования и пр.

Нечетко-значные модели обычно применяются в случаях, в которых лингвистические переменные используются для описания объектов предметной области. Лингвистические переменные могут быть языковой единицей (словом, словосочетанием и т.д.), отражающей свойства объектов, лингвистическим квантором, определенным на множестве объектов и т.п.

При этом Zинтерпретируется лингвистическим значением и представляется некоторым нечетким множеством.