
- •Глава 1
- •Искусственный интеллект
- •Фактуальное и операционное знание
- •Признаки иис
- •Системы с интеллектуальным интерфейсом
- •Экспертные системы
- •Самообучающиеся системы
- •Адаптивные информационные системы
- •Языки программирования для ии и языки представления знаний
- •Глава 2
- •Данные и знания
- •Модели представления знаний
- •Глава 3
- •Системы продукций
- •Стратегии поиска в пространстве состояний
- •Рекурсивный поиск
- •Глава 4
- •Введение в экспертные системы. Определение и структура
- •Классификация экспертных систем
- •Коллектив разработчиков
- •Технология проектирования и разработки
- •Глава 5
- •Поле знаний
- •Стратегии получения знаний
- •Теоретические аспекты извлечения знаний
- •Теоретические аспекты структурирования знаний
- •Технологии инженерии знаний
- •Глава 6
- •Задача классификации
- •Деревья решений
- •Искусственные нейронные сети
- •Глава 7
- •Способы аналитической обработки данных
- •Некоторые бизнес-приложения Data Mining
- •Типы закономерностей
- •Процесс нахождения нового знания
- •Глава 1 2
- •Глава 2 15
- •Глава 3 23
- •Глава 4 45
- •Глава 5 54
- •Глава 6 62
- •Глава 7 88
С. П. Сидоров, С. И. Дудов
ВВЕДЕНИЕ
ВИНТЕЛЛЕКТУАЛЬНЫЕ
ИНФОРМАЦИОННЫЕ
СИСТЕМЫ
УДК 004.8 (075.8) ББК 32.813я73 C34
Сидоров С. П., Дудов С. И.
С34 Введение в интеллектуальные информационные системы: Учеб. пособие для студентов мех.-мат. ф-та, обучающихся по специальности «Прикладная информатика (по областям)». — 2-е изд., перераб., доп. — Саратов: Изд-во Сарат. ун-та, 2007. - 112 с.: ил.
ISBN 978-5-292-03700-2
Пособие посвящено некоторым вопросам проектирования интеллектуальных информационных систем. Особое внимание уделяется представлению знаний, системам продукций искусственного интеллекта, экспертным системам и интеллектуальному анализу данных.
Для студентов механико-математического факультета, обучающихся по специальности «Прикладная информатика (по областям)», а также для слушателей Института дополнительного профессионального образования СГУ.
Рекомендуют к печати:
Кафедра математической экономики механико-математического факультета Саратовского государственного университета Доктор технических наук, профессор В. А. Кушников Кандидат физико-математических наук Л. Б. Тяпаев
УДК 004.8 (075.8) ББК 32.813я73
Работа издана в авторской редакции
ISBN 978-5-292-03700-2
© Сидоров С. П., Дудов С. И., 2007 © Саратовский государственный университет, 2007
Введение
В настоящее время актуальным направлением совершенствования программного обеспечения является его интеллектуализация. Под этим понимается, в частности, применение декларативных языков для описания постановок задач, способов их решения, а также смещение «центра управления» процессом решения задачи от пользователя к программной системе. Это должно позволить в будущем не только обеспечить ускорение процесса решения специфических практических задач, но и понизить требования к квалификации пользователя без потери качества решения поставленной задачи.
Предстоит новый скачок развития информационных технологий, следующая фаза которого будет опираться на интеллектуализацию всех компонентов информационных технологий, которая является необходимым условием преодоления сегодняшнего барьера между компьютером и массовым пользователем, обеспечивающим естественность их взаимодействия и эффективность решения общей задачи. Интеллектуализация включает в себя максимальное повышение уровня взаимодействия пользователь — компьютер, а также высокую специализацию обстановки под класс задач пользователя, включающую достаточно полную систему знаний о предметной области.
Изучение различных подходов к интеллектуализации прикладного программного обеспечения и разработке интеллектуальных информационных систем является необходимым для специалистов в области разработки прикладного программного обеспечения как в сфере экономики, так и в сфере юриспруденции.
Данное учебное пособие написано в соответствии с программой дисциплины «Интеллектуальные информационные системы» из государственного стандарта специальности «Прикладная информатика (по областям)».
В первой главе пособия указаны признаки, характеризующие интеллектуальные информационные системы (ИИС), и на их основе проводится классификация таких систем. Вторая глава посвящена рассмотрению наиболее распространенных моделей представления знаний, таких как продукционная модель, фреймы, семантические сети, формальная логическая модель. В третьей главе подробно изучается работа систем продукций. Приводятся различные алгоритмы поиска в пространстве состояний. Четвертая и пятая главы посвящены некоторым вопросам проектирования экспертных систем и баз знаний. В частности, рассматривается проблема переноса компетентности эксперта в базу знаний и различные подходы к ее решению. В шестой главе приведен ряд методов машинного обучения. Рассматривается построение деревьев решений и использование искусственных нейронных сетей для решения практических задач.
Второе издание пособия дополнено седьмой главой, в которой рассматриваются вопросы, связанные с использованием систем интеллектуального анализа данных.
Глава 1
Особенности и признаки ИИС
Искусственный интеллект
Наука «искусственный интеллект» (artificial intelligence) входит в комплекс компьютерных наук, а создаваемые на ее основе технологии относятся к информационным технологиям. Задачей этой науки является обеспечение разумных рассуждений и действий с помощью вычислительных систем и иных искусственных устройств.
В моделировании искусственного интеллекта исторически сложились три основных направления.
В рамках первого подхода объектом исследований являются структура и механизмы работы мозга человека, а конечная цель заключается в раскрытии тайн мышления. Необходимыми этапами исследований в этом направлении являются построение моделей на основе психофизиологических данных, проведение экспериментов с ними, выдвижение новых гипотез относительно механизмов интеллектуальной деятельности, совершенствование моделей.
Второй подход в качестве объекта исследования рассматривает искусственный интеллект (ИИ). В этом случае речь идет о моделировании интеллектуальной деятельности с помощью вычислительных машин. Целью работ в этом направлении является создание алгоритмического и программного обеспечения вычислительных машин, позволяющего решать интеллектуальные задачи не хуже человека.
Наконец, третий подход ориентирован на создание смешанных человеко-машинных, или, как еще говорят, интерактивных информационных систем, на симбиоз возможностей естественного и искусственного интеллекта. Важнейшими проблемами в этих исследованиях является оптимальное распределение функций между естественным и искусственным интеллектом и организация диалога между человеком и машиной.
Фактуальное и операционное знание
Любая информационная система (ИС) выполняет следующие функции: воспринимает вводимые пользователем информационные запросы и необходимые исходные данные, обрабатывает введенные и хранимые в системе данные в соответствии с известным алгоритмом и формирует требуемую выходную информацию. С точки зрения реализации перечисленных функций ИС
можно рассматривать как фабрику, производящую информацию, в которой заказом является информационный запрос, а инструментом (оборудованием) — знание, с помощью которого данные преобразуются в информацию.
Знание имеет двоякую природу: фактуальную и операционную.
Фактуальное знание — это осмысленные и понятые данные. Данные сами по себе —это специально организованные знаки на каком-либо носителе.
Операционное знание — это те общие зависимости между фактами, которые позволяют интерпретировать данные или извлекать из них информацию. Информация по сути — это новое и полезное знание для решения каких- либо задач.
Часто фактуальное знание называют экстенсиональным (детализированным), а операционное знание — интенсиональным (обобщенным).
Процесс извлечения информации из данных сводится к адекватному соединению операционного и фактуального знаний и в различных типах ИС выполняется по разному. Самый простой путь их соединения заключается в рамках одной прикладной программы (рис. 1).
ПРОГРАММА
АЛГОРИТМ
Правила
преобразования
данных
Управляющая
структура
Рис. 1. Структура программы
Таким образом, операционное знание (алгоритм) и фактуальное знание (структура данных) неотделимы друг от друга. Однако, если в ходе эксплуатации ИС выяснится потребность в модификации одного из двух компонентов программы, то возникнет необходимость ее переписывания. Это объясняется тем, что полным знанием проблемной области обладает только разработчик ИС, а программа служит «недумающим исполнителем» знания разработчика. Конечный же пользователь вследствие процедурности и машинной ориентированности представления знаний понимает лишь внешнюю сторону процесса обработки данных и никак не может на него влиять.
Следствием перечисленных недостатков является плохая жизнеспособность ИС или неадаптивность к изменениям информационных потребностей. Кроме того, в силу детерминированности алгоритмов решаемых задач ИС не способна к формированию у пользователя знания о действиях в не полностью определенных ситуациях.
В системах, основанных на обработке баз данных (СБД — Data Base Systems), происходит отделение фактуального и операционного знаний друг от друга. Первое организуется в виде базы данных, второе —в виде программ. Причем программа может автоматически генерироваться по запросу пользователя (например, реализация SQL- или QBE- запросов). В качестве посредника между программой и базой данных выступает программный инструмент доступа к данным — система управления базой данных (СУБД) (рис. 2).
Программа |
|
СУБД |
|
База |
|
|
|
данных |
Рис. 2. Структура СБД
Концепция независимости программ от данных позволяет повысить гибкость ИС по выполнению произвольных информационных запросов. Однако эта гибкость в силу процедурности представления операционного знания имеет четко определенные границы. Для формулирования информационного запроса пользователь должен ясно представлять себе структуру базы данных и до определенной степени алгоритм решения задачи. Следовательно, пользователь должен достаточно хорошо разбираться в проблемной области, в логической структуре базы данных и алгоритме программы. Концептуальная схема базы данных выступает в основном только в роли промежуточного звена в процессе отображения логической структуры данных на структуру данных прикладной программы.
Общие недостатки традиционных информационных систем, к которым относятся системы первых двух типов, заключаются в слабой адаптивности к изменениям в предметной области и информационным потребностям пользователей, в невозможности решать плохо формализуемые задачи, с которыми управленческие работники постоянно имеют дело. Перечисленные недостатки устраняются в интеллектуальных информационных системах (ИИС) (рис. 3).
Рис. 3. Структура системы, основанной на обработке знаний
Анализ структуры программы показывает возможность выделения из программы операционного знания (правил преобразования данных) в так называемую базу знаний, которая в декларативной форме хранит общие для различных задач единицы знаний. При этом управляющая структура приобретает характер универсального механизма решения задач (механизма вывода), который связывает единицы знаний в исполняемые цепочки (генерируемые алгоритмы) в зависимости от конкретной постановки задачи (сформулированной в запросе цели и исходных условий). Такие системы становятся системами, основанными на обработке знаний (Knowledge Base (Based) Systems).
Следующим шагом в развитии интеллектуальных информационных систем является выделение в самостоятельную подсистему репозитория метазнания, описывающего структуру операционного и фактуального знания и отражающего модель проблемной области. В таких системах и программы, и структуры данных генерируются или компонуются из единиц знаний, описанных в репозитории, каждый раз при изменении модели проблемной области. Будем называть ИИС, обрабатывающие метазнание, системами, основанными на моделях (Model Based Systems).