- •Введение
- •Некоторые вводные понятия и определения, используемые в настоящем умк
- •Системный подход в задачах анализа, моделирования и структурирования ис и асу образования и науки
- •Общая архитектура информационных и информационно-аналитических систем
- •Концепция хранилищ данных (Data Warehouse)
- •Концепция Витрин Данных (Data Mart)
- •Объединенная концепция Хранилищ и Витрин Данных
- •Оперативная аналитическая обработка данных (olap)
- •Интеллектуальный анализ данных (Data Mining)
- •Типы закономерностей, выявляемых с использованием метода Data Mining
- •Классы и подклассы систем интеллектуального анализа данных
- •Эволюционное программирование
- •Решения поиска. Оптимизационные решения. Алгоритмы ограниченного перебора
- •Описания распределенных систем через множество процессов
- •Мера сложности информационных систем - сложные модели ис
- •Временная сложность
- •Полиномиальная и недетерминированная полиномиальная временная сложность систем. Np-полные проблемы
- •Искусный просмотр больших древовидных структур, оптимизационные решения с использованием динамического программирования и Гриди-алгоритмов
- •Методы описаний и формализмы спецификаций программных средств и систем
- •Абстракция в спецификации
- •Спецификация абстрактных, вычислительных структур
- •Спецификация функций
- •Базы данных и информационные системы
- •Моделирование отношений сущность/связь
- •Диаграммы сущность/связь
- •К применению систем баз данных
- •Система управления базой данных
- •Запросы к базам данных и их изменение
- •Логическое программирование
- •Решение задач в логическом программировании
- •Унификация
- •Объектно-ориентированное программирование
- •Эффективные алгоритмы и структуры данных: алгоритмы сортировки и их сложность
- •Пути в графах
- •Деревья. Упорядоченные ориентированные и отсориентированные деревья
- •Представление деревьев массивами
- •Эффективное представление множеств
- •Вычислительная структура множеств с доступом по ключу
- •Метод хэширования
- •Ресурсы и виды информационных систем. Семантическая модель реальности и идеальности
- •Информационные технологии с позиций системного анализа и проектирования ис
- •Предметная область с позиций моделирования и проектирования ис
- •Представление и структура данных в информационных системах
- •Иерархические структуры
- •Представление знаний. Классификационные системы
- •Иерархические системы. Алфавитно-предметная классификация
- •Информация как ресурс с позиций анализа ис
- •Основные виды и формы информационного обеспечения средствами ис
- •Сбор информации
- •Обработка информации
- •Некоторые обобщения по выбору архитектур и моделей ис
- •Общие принципы построения системы поддержки принятия решений в научных исследованиях, учебных проектах и работах
- •Предполагаемый состав информационно-аналитической системы, поддерживающей принятие решений в учебных и научных проектах
- •Некоторые особенности обучения, творчества и научных исследований с позиций проектировщика ис (с позиций системного подхода)
- •Компьютерное моделирование систем обучения, творчества и научного поиска
- •Имитационное моделирование
- •Выбор инструментальной среды моделирования
- •Некоторые практические рекомендации по анализу и разработке социально-экономических моделей, поддерживаемых ис, проектируемыми в интересах образования и научных исследований
- •Эффективность разработки и внедрения системы
- •Сетевой график разработки
- •Список использованных источников литературы
- •Выписка из стандарта по специальности 071900 «Информационные системы в образовании» (1999г.)
- •Минимум содержания образовательной программы по дисциплине опд-01 «Теория информационных систем» блока стандарта опд-00 «Общепрофессиональные дисциплины»
- •Содержание
Концепция хранилищ данных (Data Warehouse)
Для того чтобы существующие хранилища данных наилучшим образом способствовали принятию проектных и управленческих решений, информация должна быть представлена аналитику, преподавателю или учащемуся в нужной форме, то есть он должен иметь развитые инструменты доступа к данным хранилища и их обработки.
Автором концепции Хранилищ Данных (Data Warehouse) является Б.Инмон, который определил Хранилища Данных, как: “предметно ориентированные, интегрированные, неизменчивые, поддерживающие хронологию наборы данных, организованные для целей поддержки управления”, призванные выступать в роли “единого и единственного источника истины” обеспечивающего менеджеров и аналитиков достоверной информацией необходимой для оперативного анализа и принятия решений.
В основе концепции Хранилищ Данных лежат две основополагающие идеи:
интеграция ранее разъединенных детализированных данных (исторические архивы, данные из традиционных СОД, данные из внешних источников) в едином Хранилище Данных, их согласование и возможно агрегация;
разделение наборов данных используемых для операционной обработки и наборов данных используемых для решения задач анализа.
Кроме единого справочника метаданных, средств выгрузки, агрегации и согласования данных, концепция Хранилищ Данных подразумевает: интегрированность, неизменчивость, поддержку хронологии и согласованность данных. И если, два первых свойства (интегрированность и неизменчивость) влияют на режимы анализа данных, то последние два (поддержка хронологии и согласованность), существенно сужают список решаемых аналитических задач.
Без поддержки хронологии (наличия исторических данных) нельзя говорить о решении задач прогнозирования и анализа тенденций. Но наиболее критичными и болезненными, оказываются вопросы, связанные с согласованием данных.
Основным требованием аналитика, является даже не столько оперативность, сколько достоверность ответа. Но достоверность, в конечном счете, и определяется согласованностью. Пока не проведена работа по взаимному согласованию значений данных из различных источников, сложно говорить об их достоверности. На практике различные ИС дают различные, иногда противоречивые ответы на один и тот же запрос. Противодействие этому негативному для образования и науки явлению – одна из основных задач создателя информационной системы для научных и образовательных технологий.
Концепция Витрин Данных (Data Mart)
Концепция Витрин Данных (Data Mart) была предложена Forrester Research ещё в 1991. По замыслу авторов, Витрины Данных: - множество тематических БД, содержащих информацию, относящуюся к отдельным аспектам деятельности организации, пользователей.
Концепция Витрин Данных имеет ряд несомненных достоинств:
аналитики видят и работают только с теми данными, которые им реально нужны;
целевая БД Витрины Данных, максимально приближена к конечному пользователю;
витрины Данных обычно содержат тематические подмножества заранее агрегированных данных, их проще проектировать и настраивать;
для реализации Витрин Данных не требуются особо мощная вычислительная техника.
Однако, концепция Витрин Данных имеет и очень серьёзные пробелы. По существу, здесь предполагается реализация территориально распределённой информационной системы с мало контролируемой избыточностью, но не предлагается способов, как обеспечить целостность и непротиворечивость хранимых в ней данных.
