Информационные системы
системы хранения инф в специальным образом организованной форме, обеспечивающие ее ввод и манипуляции: поиск, подготовку отчетов. Идея ИС и некоторые принципы их организации возникли до появления ЭВМ (библиотеки, архивы, словари).
-
Информационно–справочные и поисковые;
-
Системы, обеспечивающие автоматизацию документооборота и учета, в т.ч. бухгалтерского;
-
АСУ(автом. сис. управления), АСУП (предприятия);
-
Экспертные системы;
-
АСНИ (автом. сис. научных исследований), САПР (сис. автом. проектирования), ГИС (геоинф. сис);
-
Обучающие ИС.
Функция ИС – сбор, накопление, хранение, защита инф, ее обработка и выдача в определенной форме. Цель ИС -
Направление развития ИС – их интеллектуальные функции:
-
Интерфейс на естественном языке;
-
Поддержка принятия решений на основе имеющейся инф.
БАНКИ ИНФОРМАЦИИ (БИ), типы:
Банки данных (БкД) – хранится универсальная, необходимая для решения разных прикладных задач, информация об определенной предметной области в специальном представлении. Сами данные образуют БД, а банк содержит программные средства обработки данных и реализации запросов (=БД + СУБД + прикладные проги).
Банки знаний (БнЗн) =база знаний + оболочка экспертной системы
Банки документов (БДок) =база документов + инф-поисковая система
Классификация БИ:
По назначению:
-
Информационно-справочные системы;
-
Банки данных в АСУ;
-
Банки данных в АСНИ
По режиму функционирования:
-
Пакетные (неск задач посылаются на сервер в одном пакете, и через нек-рое время приходят результаты/ ответы на запросы);
-
Диалоговые (работа происходит в on-line при поддержании интерфейса с пользователем);
-
Смешанные.
По архитектуре:
-
Централизованные;
-
Распределенные.
БДок (исторически первые) – объект хранения – документ/факт. Для обеспечения поиска необходима семантическая обработка – индексация. Компоненты БДок:
-
Массив документов;
-
Информационно-поисковый язык, (ИПЯ) для отображения содержания документов, формирования запросов;
-
Правила, алгоритмы, методы индексирования и поиска;
-
Комплекс программных и аппаратных средств, с помощью которых реализуется хранение, накопление и поиск;
-
Персонал (администраторы, аналитики, программисты)
Режимы работы:
-
Избирательное распределение инф, обеспечивающее регулярное информирование юзера о поступлениях;
-
Ретроспективный поиск инф по разовым запросам во всем массиве документов.
Индексирование документа:
-
Выявление основного смыслового содержания;
-
Описание на ИПЯ ПОД (поисковый образ документа)
При выполнении ретроспективного поиска (так наз поиск в БДок) производится:
-
Выявление основного смыслового содержания запроса;
-
Получение ПОЗ (поисковый образ запроса) на ИПЯ.
Поиск документов – сопоставление ПОД и ПОЗ. Качество поиска зависит от критериев смыслового соответствия:
-
Теоретико-множественные (оценка степени совпадения лексических единиц, используемых в ПОД и ПОЗ);
-
Относительная инф значимость отдельных лексических единиц (высчитывается весовыми коэффициентами);
-
Логические критерии (конъюнкция, дизъюнкция).
ИПЯ:
-
Классификационные (напр. универсальная десятичная классификация (УДК));
-
Дескрипторные;
-
Комбинированные.
Целесообразность применения того или иного языка во многом зависит от назначения информационной системы, степени ее автоматизации. Для описания документов в библиотеках, общих и технических архивах обычно применяют классификационные языки. В автоматизированных информационно-поисковых системах используются, главным образом, дескрипторные языки.
Банк педагогической информации {пример БИ из Хеннера}– хранения инф, циркулирующей в системе образования страны. Содержание:
-
Учебная литература, авторские курсы;
-
Методы обучения;
-
Аспекты педагогической науки;
-
Инновации в образовании;
-
Повышение квалификации работников образования;
-
Правовая основа педагогической деятельности.
Структурная единица хранения инф – инф-пед модуль. Это текстовый файл, состоящий из двух полей: поле поискового образа документа и поле записи данных.
БАЗЫ ДАННЫХ.
БД - это реализов-я с пом К. информац-я стр-ра (модель), отраж-я сост-е объектов и их отнош-я. Основой СУБД являются два языка – ЯОД (описания данных) и ЯМД (манипулирования данными, напр SQL - Structured Query Language).
Проектирование БД.
Этапы процесса создания ИС:
-
Построение модели данных: опр объекты описания, стр-ры этих объектов, тип отнош м/у объектами;
-
Проектирование БД;
-
Создание меню приложения;
-
Создание запросов;
-
Создание экранных форм, отчетов;
-
Генерация приложения как исполняемой проги;
Требования к современным БД:
-
Адекватность БД предметной области;
-
Независимость данных;
-
Быстродействие и производительность;
-
Обеспечение защиты от несанкционированного доступа или случайного уничтожения данных;
-
Гибкость и адаптивность структуры данных;
-
Динамичность данных и способность к расширению;
-
Возм-ть поиска по многим ключам.
Принципы построения БД:
-
Централизация управления (передача всех функций управления данными единому комплексу программ);
-
Интеграция данных (объединение отдельных несвязанных данных в единую БД, облегчение поиска, избыточности);
-
Независимость данных;
-
Минимальная избыточность хранимых данных;
-
Целостность базы данных (д б огр. диапазона значений);
-
Связанность данных
Хар-ки БД:
1)Полнота - чем полнее БД, тем вероятнее, что она сод нужную инф (однако, не д.б. избыт инф-и);
2)правильная организация — чем лучше структурир БД, тем легче в ней найти необх свед-я;
2)актуальность - БД м.б. дост-но точной и полной, если она пост-но обновл-ся, т.е. необх, чтобы БД в каждый момент времени соотв-ла сост-ю отображ-го объекта;
3)удобство для исп-я - БД д.б. проста и удобна в исп-нии и иметь развитые методы доступа к части инф-ции.
Уровни представления данных:
К любой БД возможен подход на следующих уровнях:
-
Представление данных юзера (логический – внешний);
-
Администратора (логический – концептуальный);
-
Системного программиста (физический – внутренний).
Модели данных:
-
Иерархическая (древовидная структура) (отношения 1:M);
-
Сетевая (многосвязная структура) (M:M);
-
Реляционная (таблицы).
-
Объектно-ориентир = реляц + сетевая модель (исп-ся для крупных БД)
Элементы реляционной модели данных:
Отношение |
|
Таблица |
Схема отношения |
|
Строка заголовков таблицы |
Картеж |
|
Строка таблицы |
Сущность |
|
Описание свойств объекта |
Атрибут |
|
Заголовок столбца таблицы |
Первичный ключ |
|
Один/несколько атрибутов |
Тип данных |
|
Тип значений элементов таблицы |
Домен |
|
Область определения атрибута |
——Проектирование БД методом нормальных форм——
Существует избыточное и неизбыточное дублирование данных.
Декомпозиция – отношение разбивается на несколько.
Для устранения избыточности – нормализация отношений.