- •Тверской государственный университет н.А. Семенов Интеллектуальные информационные технологии
- •Введение
- •Глава 1. Интеллектуальные информационные системы
- •1.2. Данные и знания
- •Эволюция развития информационных систем
- •1.4. Основные разновидности иис и характеристики решаемых задач
- •1.5. Классификация иис
- •Глава 2. Модели представления знаний
- •2.1. Продукционная модель
- •2.2. Формально-логическая модель
- •2.3. Фреймовая модель
- •2.4. Семантические сети
- •Глава 3. Структура и технология проектирования экспертных систем
- •3.1. Структура статической и динамической эс
- •3.2. Характеристики, стадии существования и этапы проектирования статических эс
- •Глава 4. Методы обработки знаний в интеллектуальных системах. Нечеткие знания
- •4.1. Интерпретатор правил и управление выводом
- •4.2. Нечеткие знания и нечеткая логика
- •Глава 5. Теоретические основы инженерии знаний
- •5.1. Процедура извлечения знаний
- •С применением
- •5.3. Методы извлечения знаний
- •Глава 6. Нейронные сети
- •6.1. Искусственный нейрон и функции активации
- •6.2. Нейронные сети с прямой связью
- •6.3. Алгоритмы обучения нейронных сетей
- •Глава 7. Технология создания экономических советующих систем
- •7.1. Определение и виды информационных технологий
- •7.2. Технология «Ресурс – Обучение – Цель»
- •7.3. Определение коэффициента важности целей
- •Глава 8. Программный инструментарий разработки систем, основанных на знаниях
- •8.1. Цели и принципы технологии разработки программных средств
- •8.2. Технология и инструментарий разработки программных средств
- •Глава 9. Интеллектуальные Интернет-технологии
- •9.1. Интеллектуальные агенты
- •9.2. Мультиагентные системы
- •Мультиагентные системы различного функционального назначения
- •Глава 10. Новые тенденции инженерии знаний,
- •10.1. Методы извлечения глубинных пластов экспертного знания
- •10.2. Хранилища данных
- •10.3. Управление знаниями
- •10.4. Технология создания систем управления знаниями
- •Глава 11. Интеллектуальные информационные системы в условиях неопределенности и риска
- •11.1. Понятие риска в сппр слабоструктурированных проблем
- •11.2. Реализация эс инвестиционного проектирования
- •* Эс определения целей инвестирования капитала.
- •Глава 12. Системы, ориентированные на естественно-языковые запросы. Машинное обучение
- •12.1. Естественно-языковые интерфейсы
- •12.2. Машинное обучение
- •Библиографический список
- •Оглавление
1.2. Данные и знания
Данные – это информация, полученная в результате наблюдений или измерений отдельных свойств (атрибутов), характеризующих объекты, процессы и явления предметной области. При обработке на компьютере данные трансформируются, условно проходя следующие этапы:
данные как результат измерений и наблюдений;
данные на материальных носителях информации (таблицы, протоколы);
структуры данных в виде диаграмм, графиков, функций;
данные на языке описания (сетевые, иерархические, реляционные модели представления данных);
базы данных (БД) на машинных носителях информации.
Знания – это связи и закономерности предметной области (принципы, модели, законы), полученные в результате практической деятельности и профессионального опыта, позволяющего специалистам ставить и решать задачи в данной области. При обработке на компьютере знания трансформируются аналогично данным:
знания в памяти человека как результат анализа опыта и мышления;
материальные носители знаний (литература, учебники, аналитические отчеты);
поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, связывающих их;
знания, описанные на языках представления знаний (формально-логические, продукционные, фреймовые модели, семантические сети);
база знаний (БЗ) на машинных носителях информации.
Существенными для понимания природы знаний являются способы определения понятий. Один из широко применяемых способов основан на идее интенсионала и экстенсионала. Интенсионал понятия – это определение его через соотнесение с понятием более высокого уровня абстракции с указанием специфических свойств. Экстенсионал – это определение понятия через перечисление его конкретных примеров. При этом интенсионалы формируют знания об объектах, а экстенсионалы объединяют данные. Вместе они формируют элементы поля знаний конкретной предметной области.
Эволюция развития информационных систем
Принятие решений относительно действий или поведения в той или иной ситуации любых субъектов осуществляется на основе информационных процессов (ИП). ИП реализует отношения объекта и субъекта и представляет собой восприятие субъектом объективной реальности в виде данных, переработку этих данных в соответствии с целевой установкой и имеющимися знаниями о зависимостях фактов в информацию. На основе полученной информации происходят обновление знания субъекта, выработка решения по возможному изменению состояния объекта и целевой установки субъекта. Следовательно, ИП может быть рассмотрен в трех аспектах:
синтаксический аспект – предполагает отображение объективной реальности в некоторой среде или на определенном языке;
семантический аспект – определяет понимание и интерпретацию данных на основе знаний субъекта, которые отражают зависимости, закономерности взаимодействия объектов;
прагматический аспект – предусматривает оценку полезности полученного нового знания субъекта в соответствии с целевой установкой для принятия решения.
В широком смысле под информацией понимаются все три аспекта отражения ИП. Любая ИС обеспечивает ввод данных, хранение, обработку информации и вывод результатов.
Знание имеет двоякую природу: предметную (фактуальную) и проблемную (операционную). Предметное знание представляет известные сведения об объектах отражаемой реальности, они накапливаются в базе данных. Проблемное знание отражает зависимости и отношения между объектами, которые позволяют интерпретировать данные или извлекать из них информацию. Проблемные знания представляются либо в алгоритмической форме, либо в декларативной форме в виде БЗ. Часто предметные знания называют экстенсиональными (детализированными), а проблемные – интенсиональными (обобщенными).
ИП с помощью компьютерной информационной системы сводится к адекватному соединению предметных и проблемных знаний, что в различных ИС осуществляется по-разному. В системах, основанных на БД, происходит отделение предметных и проблемных знаний. Первые организуются в виде БД, вторые – в виде алгоритмов и соответствующих программ. В качестве посредника при этом выступает некоторая СУБД. Концепция независимости программ от данных позволяет повысить гибкость ИС по выполнению информационных запросов, но пользователь должен знать структуру БД и алгоритм решения задачи. Недостатками традиционных ИС является слабая адаптивность к изменениям в предметной области и невозможность решения плохо формализованных задач.
Эти недостатки устраняются в ИИС. При этом проблемные знания выделяются в БЗ, которая в декларативной форме хранит общие для различных задач единицы знаний. Управляющая структура приобретает характер универсального механизма решения задач (механизма вывода).
Следующим шагом в развитии ИИС является выделение в самостоятельную подсистему (репозитарий) метазнаний (знания о знаниях), которые описывают структуру предметных и проблемных знаний. Репозитарий отражает модель проблемной области в виде совокупности данных и правил. ИИС, обрабатывающие метазнания, получили название систем, основанных на моделях. В таких системах и программы, и структуры данных генерируются или компонуются из единиц знаний, описанных в репозитарии, каждый раз при изменении модели проблемной области [3].
Для ИИС, ориентированных на генерацию алгоритмов решения задач, характерны следующие признаки:
развитые коммуникативные способности;
умение решать сложные плохо формализуемые задачи;
способность к самообучению;
адаптивность.
Коммуникативные способности ИИС характеризуют способ взаимодействия конечного пользователя с системой, в частности, возможность формулирования произвольного запроса в диалоге с ИИС на языке, максимально приближенном к естественному. Сложные плохо формализованные задачи – это задачи, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть характерны неопределенность и динамичность исходных данных и знаний. Способность к самообучению – это возможность автоматического извлечения знаний для решения задач из накопленного опыта конкретных ситуаций. Адаптивность – способность к развитию системы в соответствии с объективными изменениями модели проблемной области.
Знания могут быть классифицированы по категориям [2]:
поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;
глубинные – абстракции, аналогии, схемы, отображающие структуры и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов.
Современные ЭС работают с поверхностными знаниями. Исторически первичными были процедурные знания, то есть знания, «растворенные» в алгоритмах. Эти знания управляют данными. Для их изменения необходимо переделать программу. С развитием ИИ приоритет данных постепенно изменялся и все большая их часть сосредоточивалась в структурах данных (таблицы, списки, графы), то есть увеличивалась роль декларативных знаний.