- •Глава 1. Основные концепции искусственного интеллекта 1
- •Глава 2. Механизмы вывода в интеллектуальной системе 38
- •Глава 3. Место и роль интеллектуальных систем в автоматизированном проектировании 65
- •Глава 1. Основные концепции искусственного интеллекта
- •1.1. Основные понятия и структура исследований в области искусственного интеллекта
- •1.2. Способы представления знаний
- •1.2.1. Определение понятия знание
- •1.2.2. Продукционные модели
- •1.2.3. Семантические сети
- •1.2.4. Фреймовые модели
- •1.2.5. Исчисление предикатов
- •1.2.6. Применение теории нечетких множеств при формализации знаний
- •Глава 2. Механизмы вывода в интеллектуальной системе
- •2.1. Стратегия управления и механизм вывода в сии
- •2.2. Общие методы поиска решений в пространстве состояний
- •2.3. Дедуктивные методы поиска решений
- •Глава 3. Место и роль интеллектуальных систем в автоматизированном проектировании
- •3.1. Процесс проектирования как поиск решений
- •3.2. Структура и принципы функционирования интеллектуальной сапр
- •3.3. Интеллектуальные системы в сапр
- •3.4. Инструментальная экспертная система протей для задач проектирования и диагностики
- •3.5. Экспертная оболочка экспрэс для построения экспертных консультирующих систем в сапр
- •3.6. Экспертные системы в управлении производством на основе имитационного моделирования
1.2. Способы представления знаний
1.2.1. Определение понятия знание
Данные и знания - это основные понятия системы представления знаний, являющейся одной из главных компонент интеллектуальной системы.
Исторически в теории и практике программирования понятие «данные» видоизменялось и усложнялось. Сначала под данными понимались двоичные слова фиксированной длины. С развитием структуры вычислительных машин происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, возникли списочные и иерархические структуры. Возникло понятие абстрактных типов данных, структура которых может задаваться программистом. Появление БД знаменовало собой еще один шаг на пути организации работы с данными. Специальные средства, образующие систему управления БД (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из БД и записывать в нужном порядке в БД.
Таким образом, данные - это факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.
По мере развития исследования в области интеллектуальных систем возникла новая концепция - концепция знаний, которая стала доминирующей в исследованиях по искусственному интеллекту.
Переход от данных к знаниям является закономерным следствием развития и усложнения информационных структур, обрабатываемых на ЭВМ.
В настоящее время не существует общепризнанного формального определения понятия «знание». Так в информатике знание - это вид информации, отражающей опыт специалиста (эксперта) в определенной предметной области, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому.
Однако знания обладают рядом специфических признаков, которые позволяют отличить понятия «знание» и «база знаний» от понятий «данные» и «база данных».
Отличительные качественные свойства именно знаний определены наличием у знания избыточных возможностей по сравнению с данными. Д.А. Поспеловым и др. была предложена следующая классификация специфических признаков знаний, позволяющая определить и охарактеризовать сам термин «знание»:
внутренняя интерпретируемость;
рекурсивная структурированность;
связность, т.е. взаимосвязь отдельных единиц знаний;
семантические пространства с метрикой;
активность;
функциональная целостность.
Заметим, что первые два признака, свойственные знаниям, справедливы и для традиционно организованных структур данных.
Первый признак - внутренняя интерпретируемость, предусматривает возможность установки для информационной единицы (элемента данных или знаний) связанной с ним системы имен. Система имен включает в себя индивидуальное имя, которое присвоено данной информационной единице, а также последовательности имен тех множеств или классов, в которые это данное входит.
Таким образом, при переходе к знаниям в память машины вводится информация о некоторой протоструктуре информационных единиц, своеобразной «шапки» таблицы, где содержатся те или иные информационные единицы (данные или знания).
Она представляет собой специальное машинное слово, в котором указано, в каких разрядах хранятся данные о конкретном объекте, например, Ф.И.О. студента, год рождения, факультет, курс, номер зачетной книжки и специализация. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы Ф.И.О., года рождения, факультеты и т.п. Все эти так называемые атрибуты могут играть роль имен для тех машинных слов, которые соответствуют строкам таблицы. По ним можно осуществлять поиск нужной информации. Каждая строка таблицы будет экземпляром протоструктуры. В настоящее время СУБД обеспечивает реализацию внутренней интерпретируемости всех информационных единиц, хранимых в реляционной БД.
Наличие системы «избыточности» имен позволяет интеллектуальной системе знать, что хранится в ее базе знаний, и, следовательно, уметь отвечать на нечеткие вопросы о содержимом базы знаний или базы данных и самостоятельно находить такие данные, содержащиеся в базе данных, которые не были определены во входном потоке данных.
Второй признак - рекурсивная структурируемость, определяет свойство гибкости структуры информационной единицы, возможность ее декомпозиции, т.е. при необходимости такая информационная единица может быть расчленена на более мелкие единицы или, наоборот, объединена в более крупные системы («принцип матрешки»). Каждая информационная единица может быть включена в состав любой другой, и из каждой информационной единицы можно выделить некоторые составляющие ее информационные единицы. Это свойство предусматривает возможность произвольного установления между отдельными информационными единицами отношений типа «часть - целое», «род -вид», «элемент - класс» и т.п.
Третий признак - взаимосвязь (связность) информационных единиц -характеризует возможность установления между информационными единицами связей различного вида. Прежде всего, эти связи могут характеризовать отношения между информационными единицами. Семантика таких отношений может носить декларативный или процедурный характер. Например, две или более информационные единицы могут быть связаны отношением «одновременно», две информационные единицы могут быть связаны отношением «при- чина - следствие» или отношением «быть рядом». Эти примеры отношений характеризуют декларативные знания.
В общем случае декларативные знания - это знания, которые записаны в памяти интеллектуальной системы так, что они непосредственно доступны для использования после обращения к соответствующему полю памяти. Обычно декларативные знания используются для представления информации о свойствах и фактах предметной области. По форме представления декларативные знания противопоставляются процедурным знаниям.
Если между двумя информационными единицами установлено отношение «аргумент - функция», то оно характеризует процедурное знание, связанное с вычислением определенных функций.
Процедурные знания - это знания, хранящиеся в памяти интеллектуальной системы в виде описаний процедур, с помощью которых их можно получить. Обычно процедурные знания используются для представления информации о способах решения задач в предметной области, а также различные инструкции, методики и т.п. По форме представления процедурные знания противопоставляются декларативным знаниям.
Различают отношения структуризации, функциональные отношения, казуальные отношения и семантические отношения. С помощью первых задаются иерархии информационных единиц, вторые несут процедурную информацию, позволяющую находить или вычислять одни информационные единицы через другие, третьи задают причинно-следственные связи, четвертые соответствуют всем остальным отношениям.
Между информационными единицами могут устанавливаться и другие отношения, например, определяющие порядок выбора информационных единиц из памяти или указывающие на то, что две информационные единицы несовместимы друг с другом в одном описании.
Таким образом, в отличие от структурированности, характеризующей структуру знаний, система взаимосвязей (связность) определяет закономерности явлений, процессов, фактов, причинно-следственные отношения между ними, порождает ситуационные системы классификаций.
Перечисленные три особенности знаний позволяют определить общую модель представления знаний, которую можно назвать семантической сетью, представляющей собой иерархическую сеть, в вершинах которой находятся информационные единицы. Эти единицы снабжены индивидуальными именами. Дуги семантической сети соответствуют различным связям между информационными единицами. При этом иерархические связи определяются отношениями структуризации, а иерархические связи -отношениями других типов.
Четвертый признак - семантические пространства с метрикой . Этот признак характеризует близость или удаленность информационных единиц. И хотя нет единого мнения относительно структуры семантического пространства с метрикой, все специалисты по искусственному интеллекту считают, что знания не могут быть бессистемным «сборищем» отдельных информационных единиц, а должны быть взаимосвязанными и взаимозависимыми в некотором общем для них когнитивном семантическом пространстве.
Когнитивность - способность к умственному восприятию и переработке внешней информации. В психологии это понятие применяется для описания психических процессов личности и, особенно при изучении и понимании так называемых «психических состояний», т.е. абстракции и конкретизации, а также в тех областях, где рассматриваются такие понятия, как знание, умение или обучение.
Термин «Когнитивность» также используется в более широком смысле, обозначая сам «акт» познания или само знание. В этом контексте он может быть интерпретирован в культурном смысле как обозначающий появление и «становление» знания и концепций, связанных с этим знанием, выражающих себя как в мысли, так и в действии.
Таким образом, отдельные информационные единицы могут соотноситься между собой с помощью различных шкал. Простейшие из них -метрические шкалы. С их помощью можно устанавливать количественные соотношения и порядок тех или иных совокупностей информационных единиц.
Метрические шкалы, у которых начало отсчета абсолютно, т.е. не зависит ни от событий, ни от момента или места нахождения, называются абсолютными. Примером такой абсолютной метрической шкалы является начальное событие «Рождество Христово», от которого мы отсчитываем историческое время. С помощью этой шкалы можно упорядочить по возрасту всех людей, известных интеллектуальной системе и ответить на любой вопрос, связанный с их возрастом.
Другой тип метрических шкал - относительные метрические шкалы. Начало отсчета на них меняется, и каждый раз служит предметом специального договора. Очень часто это начало определяется текущим моментом высказывания или местом нахождения. Такое высказывание как «через полчаса я буду на кафедре Прикладной математики» проецируется именно на относительную шкалу. Для относительных шкал используют те же единицы измерений, что и для абсолютных.
Наконец, еще один вид шкал - порядковые шкалы. На них фиксируется лишь порядок информационных единиц. Примером такой шкалы может служить шкала тяжести преступлений, имеющая место в юриспруденции. В этой шкале кража - преступление менее значительное, чем убийство, а мелкое хулиганство менее значительно, нежели кража. Другим примером порядковой шкалы является шкала оценок обучающихся в университете: неудовлетворительно, удовлетворительно, хорошо, отлично. На этой шкале нет никакой метрики, и мы не можем количественно оценить, насколько оценка «хорошо» превосходит оценку «удовлетворительно».
Среди порядковых шкал выделяют нечеткие порядковые шкалы. Их иногда называют лингвистическим шкалами. Пример такой шкалы «никогда -всегда». Метки на ней характеризуют частоту появления событий или процессов. Шкала ограничена с двух сторон маркерами «никогда» и «всегда». В первом случае частота появления события равна нулю, а во втором
единице. Остальным маркерам, которым соответствует упорядоченный список нечетких квантификаторов типа «очень редко», «редко», «не часто» «не редко», «часто», «очень часто», соответствуют не точечные деления, а некоторые интервалы, величина и расположение которых зависят от интерпретации словесных оценок, относящихся к шкале. Например, можно считать, что маркеру «редко» соответствует случай, когда частота появления события лежит в интервале от 0.2 до 0.3.
Для нечетких квантификаторов при построении такой шкалы можно равномерно разделить отрезок между концевыми маркерами на такое количество отрезков, сколько промежуточных маркеров в ней находится или опросить экспертов с целью определения границ отрезков, соответствующих каждому из промежуточных маркеров.
В
теории нечетких множеств, как известно,
используются функции
принадлежности, интерпретируемые
как характеристические функции для
нечетких множеств. Функция принадлежности
для множества А обозначается символом
.
Ее значение, равное 0, соответствует
утверждению, что данный элемент х не
принадлежит А, а ее значение, равное 1,
свидетельствует о безусловной его
принадлежности данному множеству.
Промежуточные значения
не
следует трактовать в вероятностном
смысле, так как степень принадлежности
элемента к нечеткому множеству не
обязана иметь статистическую природу.
Следует отметить, что нечеткие квантификаторы фиксируют лишь порядок, образующийся на нечетких шкалах. Например, что значит «редко»? Во фразах типа «Я редко бываю в кинотеатре» и «Редко удается поехать в зарубежную командировку» вряд ли говорится об одинаковой частоте случающихся событий. Трудность сравнения между собой информационных единиц, расположенных на различных нечетких шкалах, решается путем введения универсальных нечетких шкал, на которые с помощью специальных процедур проецируются различные нечеткие шкалы, соответствующие одним и тем же спискам нечетких квантификаторов.
Кроме абсолютных и относительных метрических шкал, порядковых шкал и их смешанных типов, следует отметить оппозиционные шкалы. Как считает Д.А. Поспелов, именно оппозиционные шкалы заложили основу восприятия мира человека не как хаотического набора ситуаций и фактов, а как определенным образом упорядоченное их единство. Бинарная оппозиция типа противопоставления двух фактов, явлений или свойств, - левое и правое, мужское и женское, - лежит в основе мировосприятия у всех народов мира. Такая шкала образуется с помощью пар слов-антонимов. Примерами их могут служить красивый - безобразный, хороший - плохой, сильный - слабый и т.п. В середине оппозиционной шкалы находится нейтральное значение типа не красивый - не безобразный, не хороший — не плохой и т.п.
Постигая закономерности физического мира, с помощью оппозиционных шкал можно любое понятие естественного языка как бы спроецировать на второй план. Отсюда и употребляются эпитеты острый ум, недалекий человек и т.п.
На множестве информационных единиц упорядочение сведений в когнитивных структурах человека происходит не только благодаря оппозиционным шкалам, но и также благодаря ассоциативным связям, характеризующим ситуационную близость этих единиц. Эту связь можно было бы назвать отношением релевантности для информационных единиц. Такое отношение дает возможность выделять в информационной базе некоторые типовые ситуации (например, «покупка», «учеба», «отдых»). Отношения релевантности при работе со знанием позволяет сузить пространство поиска нужной информации и находить знания, близкие к уже найденным.
Другая оценка близости информационных единиц опирается на частоту появления тех или иных ситуаций или конкретных представителей в типовых ситуациях.
Выбор того или иного конкретного представителя из множества возможных подчиняется закону частоты его появления. Если, например, провести с представителями социума, в котором мы живем, эксперимент, в ходе которого испытуемый должен не задумываясь давать ответы на вопросы экспериментатора о названиях конкретных представителей типовых ситуаций или слов-понятий, то результат в подавляющем числе случаев будет демонстрировать действие закона частоты появления.
Если, например, мы просим назвать поэта, то, как правило, русский человек даст ответ «Пушкин», а не «Байрон». На требование назвать инструмент, мы, как правило, получим ответ «молоток».
Такие эксперименты показывают, что у нас «на языке» готовые ответы на возможные запросы к нашей памяти всегда те, которые соответствуют наиболее часто встречавшемуся верному ответу. Подобный механизм позволяет при дефиците времени на обдумывание и поиск нужной информации в памяти всегда иметь нужные «клише», наиболее часто встречавшиеся в нашей жизни.
Пятый признак знания - активность . Это принципиальное отличие знаний от данных. С самого начала своего развития программирование опиралось на первичность процедур и вторичность данных. Процедурам отводилась роль активизирующего начала. Они отражали способ решения задачи, активизировали необходимые данные, пассивно лежащие в памяти системы.
Для человека характерна познавательная активность. Он использует те или иные процедуры потому, что в его знаниях возникла определенная ситуация, т.е. для когнитивных структур в памяти человека характерна внутренняя активность.
То или иное соотношение между информационными единицами побуждает к тем или иным действиям, для реализации которых необходимо выполнить определенные процедуры. Активность базы знаний позволяет системе искусственного интеллекта формировать мотивы, ставить цели и строить процедуры их решения. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы.
В связи с непрерывным развитием теории и практики программирования программы и данные, с которым эта программа работала, были отделены друг от друга. В программе было сосредоточено процедурное знание. Оно хранило в себе информацию о том, как надо действовать, чтобы получить нужный результат. Машина выступала в роли мощного калькулятора, в котором программа играла роль активатора данных.
Знания другого типа, которые обычно называют декларативными, хранили в себе информацию о том, над чем надо выполнять эти действия. Процедурное знание формировало обращение к декларативному знанию, воплощенному на первом этапе развития программирования в пассивно лежащие в памяти машины данные.
Для интеллектуальных систем складывается противоположная ситуация, когда не процедурные знания активизируют декларативные, а, наоборот, - та или иная структура декларативных знаний оказывается активатором для процедурных знания.
Шестой признак знания - это функциональная целостность. Этот признак отражает возможность выбора желаемого результата, времени его получения, средств для получения результата, средств анализа достаточности полученного результата.
Таким образом, элементы знаний - это особым образом организованные структуры информации, которые имеют содержание, структуру, возможные связи, процедуры принятия решений.
На основании сказанного можно сделать вывод, что для систем искусственного интеллекта основное отличие знаний от данных заключается в том, что знания являются концептуальной моделью реально функционирующего некомпьютизированного знания о предметной области, в то время как данные не выполняют моделирующей функции.
Схематично отличие понятия «данные» от понятия «знания» можно представить в виде следующего рис. 1.3.
Совокупность средств, обеспечивающих работу со знанием, образует систему управления базой знаний (СУБЗ), разработка которых сейчас усиленно развивается.
Все знания, которые можно поместить в базу знаний СИИ, можно классифицировать по следующим признакам:
цели, т.е. знания, определяющие смысл функционирования системы в данной предметной области и мотивирующие ее поведение;
объекты, т.е. знания об объектах окружающего мира, позволяющие классифицировать и описывать объекты. Знания об объектах называют фактами;
процессы, т.е. знания, позволяющие характеризовать или объяснить определенные множества временных изменений объектов, как своеобразный отчет о различиях, имеющих место в последовательности состояния объекта;
правила, т.е. знания, характеризующие «умение» выполнять какие- либо процессы и закономерности протекания этих процессов. Большая часть процессов принятия решения (выбор конструкции изделия, разработка схемы, планирование работ) предполагает использование правил;
метазнания, т.е. знания о том, что интеллектуальная система знает, например, об объеме ее собственных знаний или о границах ее возможностей -эти знания позволяют системе предсказать значения свойств проектируемых объектов и процессов, отсутствующие во входном сообщении, ускорить анализ входного сообщения, решение задач понимания и вывода решения.
Рис. 1.3. Отличительные свойства «знаний» от «данных»
