
- •Введение в проектирование баз данных, информационных и экспертных систем
- •Проектирование информационных систем, ориентированных на анализ данных
- •Модели данных, которые используются для хранения данных (Эдгар Кодд)
- •Правила Кодда
- •Методы аналитической обработки данных
- •Основные элементы data mining:
- •Классы систем data mining:
- •Документальные системы
- •Структура дипс
- •Формальное представление семантики документов
- •Обработка входящей информации в дипс
- •Рубрицирование на знаниях
- •Методы статистической обработки текстов
- •Поиск текстовой информации
- •Модели представления документов и запросов Булева модель
- •Пространственно-векторная модель
- •Векторные модели
- •Обратная связь с пользователем дипс
- •Модификация представления запроса
- •Модификация представлений документов
- •Оценка качества дипс
- •Лабораторная работа №2
- •Коллективная разработка информационных систем
- •Достоинства профессионального программирования:
- •Недостатки (сложности) профессии:
- •Почему проваливаются программные продукты:
- •Календарное планирование работ сетевыми методами
- •Сетевая модель программы
- •Пример:
- •Расчет сетевой модели
- •Пример:
- •Распределение ресурсов при календарном планировании
- •Учет стоимости при оптимизации плана
- •Проблемы разработки программного обеспечения Основные проблемы:
- •Основные причины провала разработки:
- •Рекомендации по разработке:
- •Методологии системного моделирования
- •Структура системы
- •Методология структурного системного анализа (sadt)
- •Объектно-ориентированный анализ и проектирование, uml
- •Основные принципы моделирования сложных систем
- •Общая структура uml
- •Описание метамодели uml
- •Основные виды диаграмм
- •Основные рекомендации для составления диаграмм
Введение в проектирование баз данных, информационных и экспертных систем
Из реферативнных подборок В.А. Мордвинова
На правах рукописи
Материалы лекций приведены в конспектном виде, сопровождаются описанием типовой лабораторной работы. Здесь опущены важные в дисциплине «Проектирование ИС» вопросы аналитических исследований ИС на основе семантико-энтропийного анализа, вопросы расчета и обеспечения производительности ИС и ее энтальпии, вопросы определения и обеспечения полного жизненного цикла систем и проекта, вопросы стандартизации проектирования, подготовки и выпуска проектной документации, вопросы полного менеджмента проекта на основе метода конвергенции-дивергенции и некоторые другие, транслируемые в иных публикациях и реферативных подборках, что связано исключительно с тем, что настоящая подборка имеет уровень введения в обсуждаемые дисциплины.
Классификация информационных систем
Документальные, документографические (в текстовом виде);
Фактографические (хранятся данные в структурированном виде);
Документальные системы служат для работы с документами, написанными на словесном языке (книги, акты и т.д.). Наиболее распространенные — информационно-поисковые системы (ИПС). Эти системы существенно отличаются от фактографических способом хранения и обработки информации.
Фактографические системы накапливают и обрабатывают информацию в виде специальных структур. Центральным элементом таких систем есть база данных под управлением СУБД. Обработкой данных в этом случае есть ввод, хранение, сортировка, вычисление и т.д. Итогом работы, как правило, есть отчеты. Как правило, это распределенные системы, проектирование которых играет решающую роль для их создания и оптимальной работы. Применение средств автоматизированного проектирования и специальных языков проектирования существенно упрощает создание и документирование таких систем.
Фактографические системы делятся на основные два класса:
Системы обработки данных (транзакций) — On-Line Transaction Processing (OLTP );
Системы анализа и принятия решений. Это аналитические системы, ориентированные на выполнение запросов, которые требуют статистической обработки исторически накопленных данных и нацелены на прогнозирование данных. Они называются системой оперативной аналитической обработки — On-Line Analysis Processing (OLAP). Развитием OLAP систем явились системы добычи данных (DataMining).
Системы OLAP требуют специальных структур для хранения или представления данных (кубы данных — хранилища).
Проектирование информационных систем, ориентированных на анализ данных
Такие системы основаны на БД с огромным количеством информации, анализировать которую затруднительно или невозможно обычными методами.
Системы OLTP имеют только средства оперативного анализа для небольшого количества данных. Такой анализ не позволяет выявить скрытые закономерности, делать прогноз для стратегического планирования. Это привело к созданию хранилищ данных или многомерных баз данных. Такие структуры не позволяют эффективно обрабатывать оперативную информацию, но позволяют легко и быстро получать интегральную информацию. Хранилища данных появились в начале 90-х годов.
Системы OLAP отличаются сложными аналитическими запросами, которые выполняются в обычных системах очень долго. Применяются киоски данных.
Запросы, которые формулируются к хранилищу данных, обычно более сложные, чем позволяет SQL.
ExpressUGL — ненормализованные данные.
Хранилища данных строятся на основе OLTP систем.