
- •Интеллектуальные информационные системы учебное пособие
- •Тула 2010
- •3. Экспертные системы 47
- •8. Системы с интеллектуальным интерфейсом 143
- •9. Многоагентные системы 158
- •Предисловие
- •1. Искусственный интеллект и интеллектуальные информационные системы
- •1.1. Введение в искусственный интеллект
- •1.1.1. Искусственный интеллект: основные понятия и решаемые задачи
- •1.1.2. Подходы к построению систем искусственного интеллекта
- •1.1.3. Интеллектуальные информационные системы: понятие и отличительные особенности
- •1.2. Основные классы интеллектуальных информационных систем
- •1.2.1. Экспертные системы
- •1.2.2. Самообучающиеся системы
- •1.2.3. Адаптивные информационные системы
- •1.2.4. Системы с интеллектуальным интерфейсом
- •1.2.5. Многоагентные системы
- •1.3. Основы проектирования интеллектуальных информационных систем
- •1.3.1. Структура и этапы разработки интеллектуальных информационных систем
- •1.3.2. Логическое проектирование
- •1.3.3. Физическое проектирование
- •1.3.4. Использование прототипного проектирования
- •Контрольные тесты
- •2. Традиционные способы представления и обработки знаний в интеллектуальных информационных системах
- •2.1. Знания и их использование в интеллектуальных информационных системах
- •2.1.1. Понятие знаний и их отличие от данных
- •2.1.2. Классификация знаний
- •2.1.3. Логический вывод. Использование дедукции, индукции и аналогии
- •2.1.4. Представление знаний в интеллектуальных информационных системах
- •2.2. Типичные модели представления знаний
- •2.2.1. Логическая модель
- •2.2.2. Продукционная модель
- •2.2.3. Семантическая сеть
- •2.2.4. Фреймовая модель
- •2.2.5. Объектно-ориентированная модель
- •2.3. Представление и формализация нечетких знаний
- •2.3.1. Основные определения нечетких множеств
- •2.3.2. Операции с нечеткими множествами
- •2.3.3. Нечеткие отношения
- •2.3.4. Нечеткая и лингвистическая переменные
- •Контрольные тесты
- •3. Экспертные системы
- •3.1. Структура и режимы работы экспертных систем
- •3.1.1. Основные элементы экспертных систем
- •3.1.2. Режимы работы экспертных систем
- •3.1.3. Участники разработки экспертных систем
- •3.2. Классификация экспертных систем
- •3.2.1. Классификация по сложности решаемых задач
- •3.2.2. Классификация по типу решаемых задач
- •3.2.3. Основные классы экспертных систем: классифицирующие, доопределяющие, трансформирующие, многоагентные
- •3.3. Поиск решений в экспертных системах
- •3.3.1. Поиск в одном пространстве
- •3.3.2. Поиск в иерархии пространств
- •3.3.3. Поиск в случае недетерминированности знаний
- •3.3.4. Алгоритм реализации логического вывода в экспертных системах
- •3.4. Методы извлечения знаний в экспертных системах
- •3.4.1. Классификация методов извлечения знаний
- •3.4.2. Коммуникативные методы извлечения знаний
- •3.4.3. Текстологические методы извлечения знаний
- •Контрольные тесты
- •4. Оlap-технология
- •4.1. Основные понятия
- •4.1.1. Хранилище данных
- •4.1.2. Применение информационных хранилищ. Извлечение знаний из данных
- •4.1.3. Основная идея olap-технологии
- •12 Признаков olap данных
- •4.1.4. Структура хранилища данных в оlap-системах
- •4.2. Модели и алгоритмы построения olap-систем
- •4.2.1. Rolap – обработка на основе запросов к реляционным базам данных
- •4.2.2. Molap – многомерное представление данных
- •4.2.3. Holap – гибридные системы
- •Контрольные тесты
- •5. Интеллектуальный анализ данных
- •5.1. Методы интеллектуального анализа данных
- •5.1.1. Основные понятия
- •5.1.2. Типы закономерностей, выявляемых методами интеллектуального анализа данных
- •5.1.3. Стадии интеллектуального анализа данных
- •5.1.4. Индуктивное и абдуктивное обучение
- •5.2. Алгоритмы интеллектуального анализа данных
- •5.2.2. Байесовская классификация
- •5.2.3. Деревья решений
- •5.2.4. Методы классификации с использованием функций
- •5.2.5. Метод "ближайшего соседа" или системы рассуждений на основе аналогичных случаев
- •5.2.6. Методы кластерного анализа
- •5.2.7. Развитие алгоритмов интеллектуального анализа данных
- •Контрольные тесты
- •6. Нейронные сети
- •6.1. Основные понятия
- •6.1.1. Модель искусственного нейрона
- •6.1.2. Модели нейронных сетей
- •6.1.3. Статические нейронные сети
- •6.1.4. Рекуррентные нейронные сети
- •6.2. Проектирование нейронных сетей
- •6.2.1. Этапы проектирования нейронных сетей
- •6.2.2. Метод обратного распространения ошибки
- •6.2.3. Методы обучения нейронных сетей: обучение без учителя
- •6.2.4. Нейронные сети Хопфилда и Хэмминга
- •6.2.5. Использование генетических алгоритмов для обучения нейронной сети
- •Контрольные тесты
- •5. Адаптивные системы
- •5.1. Основные классы адаптивных систем
- •5.1.1. Понятие и классификация адаптивных систем
- •5.1.2. Самонастраивающиеся адаптивные системы
- •5.1.3. Самоорганизующиеся адаптивные системы
- •5.1.4. Самообучающиеся адаптивные системы
- •5.2. Проектирование адаптивных систем
- •5.2.1. Общие подходы и требования к проектированию
- •5.2.2. Оригинальное проектирование адаптивных систем
- •5.2.3. Компонентное проектирование адаптивных систем
- •Контрольные тесты
- •8. Системы с интеллектуальным интерфейсом
- •8.1. Взаимодействие пользователя с информационной системой на естественном языке
- •8.1.1. Компьютерно-лингвистический подход к диалогу. Проблемы формализации естественном языке
- •8.1.2. Задачи обработки текстов на естественном языке
- •8.1.3. Уровни понимания текста на естественном языке
- •8.2. Построение естественно-языковых интерфейсов
- •8.2.1. Лингвистическая трансляция
- •8.2.2. Обобщенная схема естественно-языковой системы
- •8.2.3. Компонент понимания высказываний
- •8.2.4. Компонент генерации высказываний
- •8.3. Прикладные системы с интеллектуальным интерфейсом
- •8.3.1. Интеллектуальные базы данных
- •8.3.2. Интеллектуальные гипертекстовые системы
- •8.3.3. Системы когнитивной графики
- •Контрольные тесты
- •9. Многоагентные системы
- •9.1. Характеристика агента как элемента многоагентной системы
- •9.1.1. Агент: понятие и классификация
- •9.1.2. Отличительные свойства агента
- •9.2. Процесс самоорганизации в многоагентных системах
- •9.2.1. Понятие многоагентной системы
- •9.2.2. Структура памяти и принципы мышление агента
- •9.2.3. Самоорганизация многоагентной системы
- •9.2.4. Архитектура и интерфейс многоагентной системы
- •Контрольные тесты
- •Библиографический список
- •Приложение
- •Интеллектуальные информационные системы
- •3000600, Г.Тула, пр.Ленина, 92.
- •3000600, Г.Тула, ул.Болдина, 151
4.1.4. Структура хранилища данных в оlap-системах
Типичная структура хранилища данных в OLAP существенно отличается от структуры обычной реляционной СУБД. Как правило, эта структура денормализована (это позволяет повысить скорость выполнения запросов), поэтому может допускать избыточность данных. Основными составляющими структуры хранилищ данных являются таблица фактов и таблицы измерений.
Таблица фактов является основной таблицей хранилища данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Обычно говорят о четырех наиболее часто встречающихся типах фактов. К ним относятся:
- факты, связанные с транзакциями. Они основаны на отдельных событиях (типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата);
- факты, связанные с «моментальными снимками». Основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например на конец дня или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка;
- факты, связанные с элементами документа. Основаны на том или ином документе (например, счете за товар или услуги) и содержат подробную информацию об элементах этого документа (например, количестве, цене, проценте скидки);
- факты, связанные с событиями или состоянием объекта. Представляют возникновение события без подробностей о нем (например, просто факт продажи или факт отсутствия таковой без иных подробностей).
Таблица фактов, как правило, содержит уникальный составной ключ, объединяющий первичные ключи таблиц измерений. Чаще всего это целочисленные значения либо значения типа «дата/время» — ведь таблица фактов может содержать сотни тысяч или даже миллионы записей, и хранить в ней повторяющиеся текстовые описания, как правило, невыгодно — лучше поместить их в меньшие по объему таблицы измерений. При этом как ключевые, так и некоторые неключевые поля должны соответствовать будущим измерениям многомерного OLAP-куба. Помимо этого таблица фактов содержит одно или несколько числовых полей, на основании которых в дальнейшем будут получены агрегатные данные.
Для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные данные (то есть соответствующие членам нижних уровней иерархии соответствующих измерений). Следует отметить, что в таблице фактов нет никаких сведений о том, как группировать записи при вычислении агрегатных данных. Эти сведения, в дальнейшем используемые для построения иерархий в измерениях куба, содержатся в таблицах измерений.
Таблицы измерений содержат неизменяемые либо редко изменяемые данные. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Если будущее измерение, основанное на данной таблице измерений, содержит иерархию, то таблица измерений также может содержать поля, указывающие на «родителя» данного члена в этой иерархии. Нередко (но не всегда) таблица измерений может содержать и поля, указывающие на «прародителей», и иных «предков» в данной иерархии (это обычно характерно для сбалансированных иерархий), а также дополнительные атрибуты членов измерений, содержавшиеся в исходной оперативной базе данных (например, адреса и телефоны клиентов).
Каждая таблица измерений должна находиться в отношении «один ко многим» с таблицей фактов. Скорость роста таблиц измерений должна быть незначительной по сравнению со скоростью роста таблицы фактов; например, добавление новой записи в таблицу измерений, характеризующую товары, производится только при появлении нового товара, не продававшегося ранее.