5. Сетевые модели представления знаний. Семантические сети. Вычислительные сети.

Добавил:

qweqqqw Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Системы искусственного интеллекта

Файл:

Ответы к экзамену (Кафтасьев).docx

Скачиваний:

146

Добавлен:

27.05.2014

Размер:

2.7 Mб

Скачать

☆

1 / 81 2 3 4 5 6 7 8 > Следующая >>>

Экзаменационные вопросы по курсу “Системы искусственного интеллекта и принятия решений”

Научное направление ИИ. Основные направления исследований и этапы развития.
Основные модели представления знаний, их основные достоинства и недостатки.
Продукционная модель представления знаний и продукционные системы.
Сетевые модели представления знаний. Семантические сети.
Сетевые модели представления знаний. Вычислительные сети.
Фреймы и их использование для представления знаний.
Основные модели неточного представления данных и знаний. Факторы уверенности.
Субъективный байесовский метод (метод шансов). Вероятностные сети.
Основные положения теории Демпстера-Шейфера.
Нечеткие множества и нечеткие отношения.
Нечеткие выводы на основе теории нечетких множеств.
Алгоритмы нечеткого вывода Мамдани и Сугэно.
Экспертные системы. Характеристики и структура ЭС.
Классификация и основные этапы разработки ЭС.
Классификация инструментальных средств разработки ЭС. Основные характеристики инструментальной оболочки ЭСТЭР.
Методы обучения интеллектуальных систем. Деревья решений и их применение для автоматизированного построения баз знаний.
Методы индуктивного обучения и их реализация в пакете Геконал.
Генетические алгоритмы.
Стратегии поиска. Критерии оценки качества методов поиска.
Классификация систем распознавания образов.
Основные непараметрические методы распознавания образов. (Из лекции 2 по Принятию решений)
Непараметрические методы обучение дискриминантных функций. Процедуры обучения с коррекцией ошибок. (Из лекций 2 и 3 по Принятию решений)
Байесовская дискриминантная функция. Принятие решение по максимуму правдоподобия. Ошибки классификации. (Из лекции 4 по Принятию решений)
Оптимальная дискриминантная функция для нормально распределенных образов. (Из лекции 4 по Принятию решений)
Проблема выбора информативных признаков. Методы оценки информативности признаков. (Из лекции 5 по Принятию решений)
Основные цели и области применения кластерного анализа. Расстояния между образами, меры расстояния между кластерами. (Из лекции 6 по Принятию решений)
Кластерный анализ. Алгоритм иерархической группировки. (Из лекции 6 по Принятию решений)
Кластерный анализ. Метод K-внутригрупповых средних. (Из лекции 6 по Принятию решений)

Научное направление ИИ. Основные направления исследований и этапы развития.

Иск. интеллект можно опр-ть как научную дисциплину, которая занимается моделированием разумного поведения. Искусственный интеллект призван расширить возможности компьютерных наук, а не определить их границы. Одной из важных задач, стоящих перед исследователями, является поддержание этих усилий ясными теоретическими принципами

Участники Российской ассоциации искусственного интеллекта дают следующие определения искусственного интеллекта:

Научное направление, в рамках которого ставятся и решаются задачи аппаратного или программного моделирования тех видов человеческой деятельности, которые традиционно считаются интеллектуальными.
Свойство интеллектуальных систем выполнять функции (творческие), которые традиционно считаются прерогативой человека. При этом интеллектуальная система — это техническая или программная система, способная решать задачи, традиционно считающиеся творческими, принадлежащие конкретной предметной области, знания о которой хранятся в памяти такой системы. Структура интеллектуальной системы включает три основных блока — базу знаний, решатель и интеллектуальный интерфейс.
Наука под названием «Искусственный интеллект» входит в комплекс компьютерных наук, а создаваемые на её основе технологии к информационным технологиям. Задачей этой науки является воссоздание с помощью вычислительных систем и иных искусственных устройств разумных рассуждений и действий.

Этапы развития искусственного интеллекта:

Годы	Парадигма	Исполнитель	Системы
50-е	Нейрон и нейронные сети	Маккалох, Винер, Розенблат, Липунов А. А.	Perceptron, автоматы и мышление
60-е	Эвристический поиск	Ньюэлл, Саймон, К. Шеннон, Тьюринг, Глушков В. М., Берг А. И.	GPS, кибернетика
70-е	Представление знаний	Шортлив, Минский, Поспелов Д. А.	Mycin-мед. Экспертная система, ситуационное управление
80-е	Обучающие машины, САПР	Шпат, Холланд	CAD (Computer-aided design), EURISCO
90-е	Автоматизированные обрабатывающие центры		ЧПУ (числовое программное управление)
2000	Робототехника		Различные роботы Японии,CAD,CAE,CAN, CAQ
2008	Сингулярность		AGI (Artificial General Intelligence)

Основные направления развития:

Нейрокибернетика

Берет свое начало с работ амер. математика Розенблатта. Это направление связано с попыткой моделирования структуры мозга. Нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. Усилия нейрокибернетики были сосредоточены на создании элементов, аналогичных нейронам, и их объединении в функционирующие системы, т.е. в нейронные сети. Первые нейросети были созданы в 1956-65 гг.

Кибернетика «черного ящика»

В основу этого подхода положен принцип, противоположный нейрокибернетике. Не имеет значения, как устроено «мыслящее» устройство. Главное, чтобы на заданные входные воздействия оно реагировало так же, как человеческий мозг. Это направление искусственного интеллекта было ориентировано на поиски алгоритмов решения интеллектуальных задач на существующих моделях компьютеров.Существенный вклад в становление новой науки внесли ее пионеры: Маккарти, Минский,Ньюэлл, Саймон, Шоу, Хант и др.

Этапы развития кибернетики «черного ящика»:

1. Эвристические алгоритмы.

2. Упор на мат. логику (кон. 60х – 70е). Результат – язык Пролог.

3. Представление знаний.

Основные модели представления знаний, их основные достоинства и недостатки.

Важное место в теории искусственного интеллекта занимает проблема представления знаний, являющаяся, по мнению многих исследователей, ключевой. В общем виде модели представления знаний могут быть условно разделены на следующие классы:

1. Концептуальные модели используют эвристический метод, что позволяет при распознавании проблемы уменьшать время для ее предварительного анализа. Концептуальное описание не дает гарантии того, что метод может быть применен во всех соответствующих практических ситуациях. Практическое использование концептуальной модели влечет за собой необходимость преобразования ее в эмпирическую модель.

2. Эмпирические модели – это модели, как правило, описательного характера. Они могут варьировать от простого набора правил до полного описания.

3. Декларативные модели представления знаний основываются на предположении, что проблема представления некоторой предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом в какой-то степени оказываются раздельными синтаксические и семантические аспекты знания, что является определенным достоинством указанных форм представления из-за возможности достижения их определенной универсальности. Эти модели представляют собой обычно множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния. Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

4. Процедурные модели представляют собой модели, в которых знания содержатся в процедурах небольших программ, которые определяют, как выполнять характерные действия. При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий.

Преимущества процедурных моделей: имеют большую эффективность механизмов вывода за счет введения дополнительных знаний, способны смоделировать практически любую модель представления знаний, имеют большую выразительную силу, которая проявляется в расширенной системе выводов.

Представление знаний в экспертных системах производится с помощью специально разработанных моделей.

1. Логические модели.Основываются на представлении знаний в виде логики предикатов. Предикатом или логической функцией называется функция от любого числа аргументов, принимающая истинные значения 1 и 0. В исследованиях по искусственному интеллекту данная модель стала использоваться начиная с 50-х годов.

В системах, основанных на исчислении предикатов, знания представляются с помощью перевода утверждений об объектах некоторой предметной области в формулы логики предикатов и добавления их как аксиом в систему. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода.

Достоинство логических моделей:

– модель базируется на классическом аппарате математической логики, методы которой хорошо изучены и обоснованы;

– имеются достаточно эффективные процедуры вывода;

– база знаний предназначена для хранения большого количества аксиом, из которых по правилам вывода можно получать другие знания.

Основной недостаток:логики, адекватно отражающей человеческое мышление, еще не создано.

2. Продукционные модели.Впервые были предложены Постом в 1943 г., применены в системах искусственного интеллекта в 1972 г. При исследовании процессов рассуждения и принятия решений человеком пришли к выводу, что человек в процессе работы использует продукционные правила (правила вывода, порождающие правила).

Суть правила продукции для представления знаний состоит в том, что в левой части ставится в соответствие некоторое условие, а в правой части действие: если <перечень условия>, то <перечень действий>. Если это действие соответствует значению «истина», то выполняется действие, заданное в правой части продукции. В общем случае под условием понимается некоторое предложение, по которому осуществляется поиск в базе знаний, а под действием – действия, выполняемые при успешном исходе поиска.

Достоинства продукционных моделей:

– наглядность;

– высокая модульность – отдельные логические правила могут быть добавлены в базу знаний, удалены или изменены независимо от других, модульный принцип разработки систем позволяет автоматизировать их проектирование;

– легкость внесения дополнений и изменений;

– простота логического вывода.

Недостатки продукционных моделей:

– при большом количестве продукционных правил в базе знаний, изменение старого правила или добавления нового приводит к непредсказуемым побочным эффектам;

– затруднительна оценка целостного образа знаний, содержащего в системе.

3. Сетевые модели.Способ представления знаний с помощью сетевых моделей наиболее близок к тому, как они представлены в текстах на естественном языке. В его основе лежит идея о том, что вся необходимая информация может быть описана как совокупность троек: объекты или понятия и бинарное отношение между ними. Наиболее общей сетевой моделью представления знаний являются семантические сети, в которых узлы и связи представляют собой объекты или понятия и их отношения, таким образом, что можно выяснить их значение.

Достоинство семантической сети:

– описание объектов и событий производится на уровне очень близком к естественному языку;

– обеспечивается возможность соединения различных фрагментов сети;

– отношения между понятиями и событиями образуют небольшое, хорошо организованное множество;

– для каждой операции над данными или знаниями можно выделить некоторый участок сети, который охватывает необходимые в данном запросе характеристики;

– обеспечивается наглядность системы знаний, представленной графически:

– близость структуры сети, представляющей знания, семантической структуре фраз на естественном языке;

– соответствие сети современным представлениям об организации долговременной памяти человека.

Недостатки семантической сети:

– сетевая модель не дает ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затруднительны;

– сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода и планирования.

4. Фреймовые модели.Фреймы были впервые предложены в качестве аппарата для представления знаний М. Минским в 1975 г. Фреймовые модели представляют собой систематизированную в виде единой теории технологическую модель памяти человека и его сознания. Под фреймом понимают минимальные структуры информации, необходимые для представления класса объектов, явлений или процессов.

Фрейм можно представить в виде сети, состоящей из вершин и дуг (отношений), в которых нижние уровни фрейма заканчиваются слотами (переменными), которые заполняются конкретной информацией при вызове фрейма. Значением слота может быть любая информация: текст, числа, математические соотношения, программы, ссылки на другие фреймы. На заполнение слотов могут быть наложены ограничения, например цена не может быть отрицательной.

Модели фреймов имеют следующие достоинства:

– способность отображать концептуальную основу организации памяти человека;

– естественность и наглядность представления, модульность;

– поддержку возможности использования значений слотов по умолчанию.

– универсальность, так как позволяют отобразить все многообразие знаний.

Основной недостаток: отсутствие механизмов управления выводом, который частично устраняется при помощи присоединенных процедур, реализуемый силами пользователя системы.

5. Нейронные сети.В настоящее время сформировалось новое научно-практическое направление – создание нейрокомпьютера, ЭВМ нового поколения, который способен к самоорганизации, обучению и имитирует некоторые способности человеческого мозга по обработке информации. Результатами явились представления знаний, основанные на массированной параллельной обработке, быстром поиске больших объемов информации и способности распознавать образцы. Технологии, направленные на достижение этих результатов относятся к нейронным вычислениям или искусственным нейронным сетям.

Продукционная модель представления знаний и продукционные системы.

Продукции(наряду с сетевыми моделями) являются наиболее популярными средствами представления знаний в информационных системах. В общем виде под продукцией понимают выражение вида A ® B. Обычное прочтение продукции выглядит так: ЕСЛИ А, ТО B. Импликация может истолковываться в обычном логическом смысле, как знак логического следования B из истинного А. Возможны и другие интерпретации продукции, например, А описывает некоторое условие, необходимое, чтобы можно было совершить действие B.

Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если (условие), то (действие)».

Под условием понимается некоторое предложение — образец, по которому осуществляется поиск в базе знаний, а под действием — действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия, и терминальными или целевыми, завершающими работу системы).

При использовании продукционной модели база знаний состоит из набора правил, Программа, управляющая перебором правил, называется машиной вывода. Чаще всего вывод бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения – к данным). Данные — это исходные факты, на основании которых запускается машина вывода.

Если в памяти системы хранится некоторый набор продукций, то они образуют систему продукций. В системе продукций должны быть заданы специальные процедуры управления продукциями, с помощью которых происходит актуализация продукций и выполнение той или иной продукции из числа актуализированных.

В состав системы продукций входит база правил (продукций), глобальная база данных и система управления. База правил – это область памяти, которая содержит совокупность знаний в форме правил вида ЕСЛИ – ТО.

Глобальная база данных— область памяти, содержащая фактические данные (факты). Система управления формирует заключения, используя базу правил и базу данных. Существуют следующие способы формирования заключений — прямые и обратные выводы.

Правила выводабывает удобно представлять в виде дерева решений. Граф — множество вершин, связанных дугами. Дерево — граф, не содержащий циклов.

В прямых выводахвыбирается один из элементов данных, содержащихся в базе данных, и если при сопоставлении этот элемент согласуется с левой частью правила (посылкой), то из правила выводится соответствующее заключение и помещается в базу данных или исполняется действие, определяемое правилом, и соответствующим образом изменяется содержимое базы данных.

В обратных выводахпроцесс начинается от поставленной цели. Если эта цель согласуется с правой частью правила (заключением), то посылка правила принимается за подцель или гипотезу. Этот процесс повторяется до тех пор, пока не будет получено совпадение подцели с данными.

При большом числе продукций в продукционной модели усложняется проверка непротиворечивости системы продукций, то есть множества правил. Поэтому число продукций, с которыми работают современные системы искусственного интеллекта, как правило, не превышает тысячи.

Продукционная модель привлекает разработчиков своей наглядностью, высокой модульностью, легкостью внесения дополнений и изменений и простотой механизма логического вывода.

Сильные стороны систем продукций:

- модульность;

- единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемной ориентацией);

- естественность (вывод заключения в продукционной системе во многом аналогичен процессу рассуждения эксперта);

- гибкость родовидовой иерархии понятий, которая поддерживается только как связь между правилами (изменение правила ведет за собой изменение в иерархии);

- простота создания и понимания отдельных правил;

- простота пополнения и модификации;

- простота механизма логического вывода.

Слабые стороны систем продукций:

- процесс вывода менее эффективен, чем в других системах, поскольку большая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;

- сложно представить родовидовую иерархию понятий;

- неясность взаимных отношений правил;

- сложность оценки целостного образа знаний;

- отличие от человеческой структуры знаний;

- отсутствие гибкости в логическом выводе.

Представление знаний с помощью продукций иногда называют «плоским», так как в продукционных системах отсутствуют средства для установления иерархий правил. Объем знаний продукционных систем растет линейно, по мере включения в нее новых фрагментов знаний, в то время как в традиционных алгоритмических системах, использующих деревья решений, зависимость между объемом база знаний и количеством знаний является логарифмической.

5. Сетевые модели представления знаний. Семантические сети. Вычислительные сети.

Сетевая модель представления знаний была предложена американским психологом Куиллианом.

В основе моделей этого типа лежит конструкция, названная семантической сетью. Семантический подход к построению систем искусственного интеллекта находит применение в системах понимания естественного языка, в вопросно-ответных системах, в различных предметно-ориентированных системах.

Термин семантическая означает смысловая, а сама семантика — это наука, устанавливающая отношения между символами и объектами, которые они обозначают, то есть наука, определяющая смысл знаков.

В самом общем случае семантическая сеть представляет собой информационную модель предметной области и имеет вид графа, вершины которого соответствуют объектам предметной области, а дуги — отношениям между ними.

Дуги могут быть определены разными методами, зависящими от вида представляемых знаний. Обычно дуги, используемые для представления иерархии, включают дуги типа «множество», «подмножество», «элемент». Семантические сети, применяемые для описания естественных языков, используют дуги типа «агент», «объект», «реципиент».

Понятиями обычно выступают абстрактные или конкретные объекты, а отношения — это связи типа: «это» («is»), «имеет частью» («has part»), «принадлежит», «любит». Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

- класс — элемент класса;

- свойство — значение;

- пример элемента класса.

Можно ввести несколько классификаций семантических сетей. Например, по количеству типов отношений:

- однородные (с единственным типом отношений);

- неоднородные (с различными типами отношений).

По типам отношений:

- бинарные (в которых отношения связывают два объекта);

- парные (в которых есть специальные отношения, связывающие более двух понятий).

Наиболее часто в семантических сетях используются следующие отношения:

- связи типа «часть-целое» («класс-подкласс», «элемент-множество» и т.п.);

- функциональные связи (определяемые обычно глаголами «производит», «влияет»...);

- количественные (больше, меньше, равно...);

- пространственные (далеко от, близко от, за, под, над...);

- временные (раньше, позже, в течение...);

- атрибутивные связи (иметь свойство, иметь значение...);

- логические связи (и, или, не) и др.

Пример: Предложения «Куин Мэри является океанским лайнером» и «Каждый океанский лайнер является кораблем». Они могут быть представлены через семантическую сеть.

Пример: Понятие «корабль».

Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, соответствующей поставленному вопросу.

В семантических сетях существует возможность представлять знания более естественным и структурированным образом, чем в других формализмах.

Основным преимуществом является то, что она более других соответствует современных представлениям об организации долговременной памяти человека.

Недостатком этой модели является сложность организации процедуры поиска вывода на семантической сети.

Для реализации семантических сетей существуют специальные сетевые языки (NET, SIMER+MIR и др.). Известны системы, использующие семантические сети в качестве языка представления знаний — PROSPECTOR, CASNET, TORUS.

В зависимости от типов связей, используемых в модели, различают классифицирующие сети, функциональные сетиисценарии. В классифицирующих сетях используются отношения структуризации. Такие сети позволяют в базах знаний вводить разные иерархические отношения между информационными единицами. Функциональные сети характеризуются наличием функциональных отношений. Их часто называютвычислительными моделями, т.к. они позволяют описывать процедуры "вычислений" одних информационных единиц через другие. В сценариях используются каузальные отношения, а также отношения типов "средство - результат", "орудие - действие" и т.п. Если в сетевой модели допускаются связи различного типа, то ее обычно называют семантической сетью.

Фреймы и их использование для представления знаний.

Фреймовая модель представления знаний – была предложена М.Минским в 1979 г. как структура знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование.

В психологии и философии известно понятие абстрактного образа. Например, слово «комната» вызывает у слушающих образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2». Из этого описания ничего нельзя убрать (например, убрав окна, получим уже чулан, а не комнату), но в нем есть «дырки», или «слоты», — это незаполненные значения некоторых атрибутов — количество окон, цвет стен, высота потолка, покрытие пола и др. В этой теории такой абстрактный образ называется фреймом.

Фреймом называется также и формализованная модель для отображения образа.

В качестве идентификатора фрейму присваивается имя фрейма. Это имя должно быть единственным во всей фреймовой системе.

Фрейм имеет определенную внутреннюю структуру, состоящую из множества элементов, называемых слотами, которым также присваиваются имена. За слотами следуют шпации, в которые помещают данные, представляющие текущие значения слотов. Каждый слот в свою очередь представляется определенной структурой данных. В значение слота подставляется конкретная информция, относящаяся к объекту, описываемому этим фреймом.

Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных ситуаций на основе поступающих данных.

Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире:

- через фреймы-структуры, для обозначения объектов и понятий (заем, залог, вексель);

- через фреймы-роли (менеджер, кассир, клиент);

- через фреймы-сценарии (банкротство, собрание акционеров, празднование именин);

- через фреймы-ситуации (тревога, авария, рабочий режим устройства) и др.

Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по AKO-связям (A-Kind-Of = это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то есть переносятся, значения аналогичных слотов.

Значением слота может быть практически что угодно: числа, формулы, тексты на естественном языке или программы, правила вывода или ссылки на другие слоты данного фрейма или других фреймов. В качестве значения слота может выступать набор слотов более низкого уровня, что позволяет реализовывать во фреймовых представлениях «принцип матрешки». Связи между фреймами задаются значениями специального слота с именем «Связь».

Структура фрейма:.

Имя фрейма– служит для идентификации фрейма в системе и должно быть уникальным. Фрейм представляет собой совокупность слотов, число которых может быть произвольным. Число слотов в каждом фрейме устанавливается проектировщиком системы.
Имя слота.Оно должно быть уникальным в пределах фрейма. Обычно имя слота представляет собой идентификатор, который наделен определенной семантикой. В качестве имени слота может выступать произвольный текст.
Указатели наследования.Они показывают, какую информацию об атрибутах слотов из фрейма верхнего уровня наследуют слоты с аналогичными именами в данном фрейме. Указатели наследования характерны для фреймовых систем иерархического типа, основанных на отношениях типа «абстрактное — конкретное».
Указатель типа данных– показывает тип значения слота. Наиболее употребляемые типы: frame — указатель на фрейм; real — вещественное число; integer — целое число; boolean — логический тип; text – фрагмент текста; list — список; table — таблица; expression — выражение; lisp — связанная процедура и т.д.
Значение слота. Оно должно соответствовать указанному типу данных и условию наследования.
Демоны.Демоном называется процедура, автоматически запускаемая при выполнении некоторого условия. Демоны автоматически запускаются при обращении к соответствующему слоту. Типы демонов связаны с условием запуска процедуры.
Присоединенная процедура.В качестве значения слота может использоваться процедура, называемая служебной в языке Лисп или методом в языках объектно-ориентированного программирования. Присоединенная процедура запускается по сообщению, переданному из другого фрейма.

Пример 1. Фрейм, описывающий человека.

Фрейм: Человек

Имя слота: Значение слота

Класс: Животное

Структурный элемент: Голова, шея, руки, ...

Рост: 30 ? 220 см

Масса: 1 ? 200 кг

Хвост: Нет

Язык: Русский, английский, ...

Связь: Обезьяна

Пример 2: Описание с помощью фреймов понятия письменного отчета.

Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Наиболее ярко достоинства фреймовых систем представления знаний проявляются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений.

К недостаткам фреймовых систем относят их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и увеличения трудоемкости внесения изменений в родовую иерархию.

Специальные языки представления знаний в сетях фреймов FRL (Frame Representation Language), KRL (Knowledge Representation Language), фреймовая оболочка Kappa, PILOT/2 и другие программные средства позволяют эффективно строить промышленные системы.

Основные модели неточного представления данных и знаний. Факторы уверенности.

В реальной жизни сужествует неопределенность (фактов, правил, заключений). Основными моделями нечеткого представления знаний являются:

Факторы уверенности
Вероятностные сети (метод шансов, метод Криса-Нейлора)
Теория Демпстера-Шейфера
Нечеткая логика и нечеткие множества
Теория возможностей

Основными критериями различия являются:

- модель описания (скаляр, интервал, функция распределения лингвистическая переменная)

- методы вывода (формула, связывающая вход и выход)

Модель факторов уверенности

Каждому высказыванию приписывается скаляр, который называется фактором уверенности (confidencefactor–CF). Это аналог вероятности, но не одно и то же.CFможет меняться в любом диапазоне. При работе сCFиспользуют алгебру факторов уверенности (отличную от вероятностной)

0 <= MB,MD<= 1

CF= 1; – абсолютная истина

0 <= CF<= 1

0 <= CF<=K

В рамках продукционной модели:

условие заключение

if(условие)thenзаключение

if(условие(a,b))thenH₁,H₂,H₃

Алгебра вычисления фактора уверенности

CFисходных предпосылокCF_a,CF_b(сообщает наблюдатель или определяется в результате применения правила)
CF правила

Для каждого заключения (гипотезы) H₁,H₂,H₃значенияCFв общем случае различны.

Необходимо определить:

Метод вычисления CF условия
Метод вычисления CFрезультата по данному правилу
Объединение CFгипотез по всем правилам

Правило 1: ifусловие 1thenHCFH₁

Правило 2: ifусловие 2thenHCFH₂

0 <= CF <= 100

Условная часть правила

минимальное значение
произведение

среднее
баланс

максимальное значение
вероятностная сумма

среднее
баланс

Объединение CF условия и заключения

произведение
минимальное значение

среднее
баланс

Объединение CFзаключений по результатам работы нескольких правил

максимальное значение
среднее вероятностной суммы и максимума
среднее
баланс

Субъективный байесовский метод (метод шанса):

ИЗ ФАЙЛОВ С КОНСПЕКТАМИ

Формула Байеса: , гдеA– гипотеза, Х – предпосылка.

Априорный шанс:

Апостериорный шанс:

Отношение правдоподобия: , где

Отношение правдоподобия для независимых XиY:

В данной схеме, на основании знаний о предметной области задаются:

Априорная вероятность гипотезы А: ; или априорный шанс
– которые могут быть описаны правилами

Если наличие предпосылок x,yподтверждается с единичной вероятностью, то на основании имеющихся данных вычисляется апостериорный шанс гипотезы А, по которому может быть найдена апостериорная вероятность. Основная проблема связана с тем, что.

Классическая схема:

При :

Задаются:

или
, для случая наблюдения предпосылок с 1-ой вероятностью
,

Вероятностная сеть:

и– гипотезы;– предпосылки;– наблюдаемые предпосылки

ИЗ ИНТЕРНЕТА

Байесовская сеть — это направленный граф без направленных циклов, в котором вершины соответствуют переменным в распределении, а рёбра соединяют «связанные» переменные. Вершины могут представлять переменные любых типов, быть взвешенными параметрами, скрытыми переменными или гипотезами. байесовская сеть может быть использована для вычисления вероятности того, чем болен пациент по наличию или отсутствию ряда симптомов, основываясь на данных о зависимости между симптомами и болезнями.

Байесовские сети с двумя и тремя переменными: тривиальные случаи

Начнём с сети из двух переменных, xиy. Здесь всего два варианта: либо междуxиyнет ребра, либо есть. Если ребра нет, это просто значит, чтоxиyнезависимы, ведь такой граф соответствует разложению.

А если ребро есть (пусть оно идёт из xвy, это не важно), мы получаем разложение, которое буквально по определению условной вероятности верно всегда, для любого распределения. Таким образом, граф из двух вершин с ребром не даёт нам новой информации.

2) Сети из трёх переменных, x,yиz. Самый простой случай – когда рёбер совсем нет.

a) Как и с двумя переменными, это значит, чтоx,yиzпросто независимы:.b) Этот случай тоже аналогичен рассмотренному выше; пусть, например, рёбра идут изxвyиz, а также изyвz. Мы получаем разложениекоторое, опять же, верно всегда, для любого совместного распределения.

Байесовские сети с тремя переменными: интересные случаи

Последовательная связь

Начнём с последовательной связи между переменными: x«влияет на»y, аy, в свою очередь, «влияет на»z.

Такой граф изображает разложение

Интуитивно это соответствует последовательной причинно-следственной связи: если вы будете бегать зимой без шапки, вы простудитесь, а если простудитесь, у вас поднимется температура. Очевидно, что xиy, а такжеyиzдруг с другом связаны, между ними даже непосредственно стрелочки проведены. Связаны ли между собой в такой сетиxиz, зависимы ли эти переменные? Конечно! Если вы бегаете зимой без шапки, вероятность получить высокую температуру повышается. Однако в такой сетиxиzсвязаны только черезy, и если мы уже знаем значениеy,xиzстановятся независимыми: если вы уже знаете, что простудились, совершенно не важно, чем это было вызвано, температура теперь повысится (или не повысится) именно от простуды. Формально это соответствует условной независимостиxиzпри условииy:

Расходящаяся связь

Следующий возможный вариант – расходящаяся связь: x«влияет» и наy, и наz.Такой граф изображает разложение

Интуитивно это соответствует двум следствиям из одной и той же причины: если вы простудитесь, у вас может подняться температура, а также может начаться насморк. Как и в предыдущем случае, очевидно, что xиy, а такжеxиzзависимы, и вопрос заключается в зависимости междуyиz. Опять же, очевидно, что эти переменные зависимы: если у вас насморк, это повышает вероятность того, что вы простудились, а значит, вероятность высокой температуры тоже повышается.

Однако в такой сети, подобно предыдущему случаю, yиzсвязаны только черезx, и если мы уже знаем значение общей причиныx,yиzстановятся независимыми: если вы уже знаете, что простудились, насморк и температура становятся независимы.

Формально это соответствует условной независимости yиzпри условииx; проверить это ещё проще, чем для последовательной связи:

Сходящаяся связь

У нас остался только один возможный вариант связи между тремя переменными: сходящаяся связь, когда xиyвместе «влияют на»z.

Разложение здесь получается такое:

Это ситуация, в которой у одного и того же следствия могут быть две разные причины: например, температура может быть следствием простуды, а может – отравления. Зависимы ли простуда и отравление? Нет! В этой ситуации, пока общее следствие неизвестно, две причины никак не связаны друг с другом, и это очень легко проверить формально:

Однако если «общее следствие»zстановится известным, ситуация меняется. Теперь общие причины известного следствия начинают влиять друг на друга. Этот феномен по-английски называется «explaining away»: предположим, что вы знаете, что у вас температура. Это сильно повышает вероятность как простуды, так и отравления. Однако если вы теперь узнаете, что отравились, вероятность простуды уменьшится – симптом «уже объяснён» одной из возможных причин, и вторая становится менее вероятной.

Основные положения теории Демпстера-Шейфера

Подход, принятый в теории Демпстера-Шефера (ТДШ) отличается от байесовского подхода и метода коэффициентов уверенности тем, что, во-первых, здесь используется не точечная оценка уверенности (коэффициент уверенности), а интервальная оценка. Такая оценка характеризуется нижней и верхней границей, что более надежно.

Предположим, что существуют две конкурирующие гипотезы h1 и h2. При отсутствии информации, поддерживающей эти гипотезы, мера доверия и правдоподобия каждой из них принадлежат отрезку [0; 1]. По мере накопления эти интервалы будут уменьшаться, а доверие гипотезам – увеличиваться. В теории Демпстера-Шефера неопределенность знаний представляется с помощью некоторого множества X. Элементы этого множества соответствуют возможным фактам или заключениям. Неопределенность состоит в том, что заранее неизвестно, какое из возможных значений примет факт или заключение . Для характеристики степени определенности в ТДШ вводится некоторая единичная мера уверенности (ее называют также единичной массой уверенности), которая распределяется между элементамиX. При этом, если вся масса (степень) уверенности приходится на один элемент , то никакой неопределенности нет. Неопределенность возникает, когда масса уверенности распределяется между несколькими элементами.

.Здесь

С каждым элементом множества X жестко связана соответствующая масса уверенности. Так, соответствует ,, . Имеются также свободные массы уверенности, , которые относятся сразу к нескольким элементам. Массасвободно перемещается между элементамии, а масса– между элементамии, т.е.закреплена за подмножеством, а- за подмножеством. Массы выражают степень уверенности в возможных значениях фактов или заключений. Так, степень уверенности в значенииможет изменяться отдо. Таким образом, степень незнания соответствует массе, местоположение которой не определено.

1 / 81 2 3 4 5 6 7 8 > Следующая >>>