
- •Информационные системы Учебное пособие для студентов по направлению подготовки
- •034700 Документоведение и архивоведение,
- •Квалификация (степень) «бакалавр»
- •Содержание
- •Пояснительная записка
- •1. Основные понятия
- •2. Стадии разработки информационных систем
- •3. Базы данных
- •4. Пример разработки информационной системы
- •5. Варианты заданий на самостоятельную работу
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Вариант 11
- •Вариант 12
- •Вариант 13
- •Вариант 14
- •Вариант 15
- •Вариант 16
- •Вариант 17
- •1.А. Форма карточки постеллажного топографического указателя
- •1.Б. Форма требования на выдачу документов, копий фонда пользования, описей
- •1.В. Форма реестра описей реестр описей
- •1.Г. Форма сведений об изменениях в составе и объеме фондов
- •664025, Иркутск, ул. Ленина, 8
3. Базы данных
Одной из составляющих информационной системы является база данных.
База данных (БД) – это поименованная совокупность структурированных данных, относящихся к определенной предметной области [9].
Проектирование базы данных осуществляется на стадии конструирования. Сбор данных начинается с изучения сущностей организации и процессов, использующих эти сущности. Сущности группируются по «сходству» (частоте их использования для выполнения тех или иных действий) и по количеству ассоциативных связей между ними (самолет – пассажир, преподаватель – дисциплина, студент – сессия и т.д.). Сущности или группы сущностей, обладающие наибольшим сходством и (или) с наибольшей частотой ассоциативных связей объединяются в предметные базы данных [11].
Известны три типа организации данных и связей между ними: иерархический (в виде дерева), сетевой и реляционный.
Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации [9].
СУБД выполняет следующие функции:
1. обмен управляющими воздействиями с ОС и прикладным ПО в процессе функционирования;
2. преобразование данных в процессе передачи из БД в прикладную область и обратно;
3. обеспечение многопользовательского режима доступа к БД;
4. обеспечение секретности доступа к данным.
Основная цель проектирования БД – это сокращение избыточности хранимых данных, а следовательно, экономия объема используемой памяти, уменьшение затрат на многократные операции обновления избыточных копий и устранение возможности возникновения противоречий из-за хранения в разных местах сведений об одном и том же объекте.
Требования к базе данных [8]:
1. Неизбыточность и непротиворечивость данных. Если каждое приложение работает со своей системой файлов, а не с единой БД, то в рамках одной прикладной области неизбежно дублирование данных. Следствием этого будет противоречивость: в одном приложении информация изменяется, а в другом – нет.
2. Защита данных от программных и аппаратных сбоев. Все виды защиты должны обеспечиваться СУБД. Сбои бывают двух видов: логический сбой и физический сбой.
3. Мобильность прикладного программного обеспечения. Прикладная программа должна быть мобильной (в рамках одной СУБД) и, кроме того, не должна зависеть от места и способа хранения данных. СУБД же создаются для разных платформ и различных ОС.
4. Секретность данных. Традиционно в БД авторизация доступа выполняется за счет аппарата внешних схем: при входе пользователь вводит имя группы и пароль. В описании схемы присутствуют ограничения на доступ к данным (в виде SQL-команд). Также применяется шифрование на физическом уровне.
Рассмотрим подробнее построение реляционных моделей данных [13]. Термин «реляционный» (от английского relation – отношение) указывает, прежде всего, на то, что такая модель хранения данных построена на взаимоотношении составляющих ее частей, которые удобно представлять в виде двумерной таблицы. Реляционная модель данных представляет информацию в виде совокупности взаимосвязанных таблиц, которые называют отношениями или реляциями.
Основные понятия реляционной модели данных.
Сущность — это реальный или виртуальный объект, имеющий существенное значение для рассматриваемой предметной области, информация о котором подлежит хранению. Если не вдаваться в подробности, то можно считать, что сущности соответствуют таблицам реляционной модели. Каждая сущность должна обладать следующими свойствами:
иметь уникальный идентификатор;
содержать один или несколько атрибутов, которые либо принадлежат сущности, либо наследуются через связь с другими сущностями;
содержать совокупность атрибутов, однозначно идентифицирующих каждый экземпляр сущности.
Атрибут. Наименьшая поименованная единица информации с определенным типом, индексируемая в системе управления базами данных (СУБД) [8].
Ключ. Набор атрибутов, однозначно определяющий один экземпляр сущности. Первичный ключ – это ключ, выделенный среди множества ключей, который систематически используют для ссылки на конкретный экземпляр сущности [3].
Кортеж. Кортеж, соответствующий данной схеме отношения, представляет собой множество пар {имя атрибута, значение}, которое содержит одно вхождение каждого имени атрибута, принадлежащего схеме отношения. «Значение» является допустимым значением домена данного атрибута (или типа данных, если понятие домена не поддерживается). Тем самым степень кортежа, то есть число элементов в нем, совпадает со степенью соответствующей схемы отношения. Иными словами, кортеж – это набор именованных значений заданного типа [13].
Связь – это соединение двух сущностей, при котором, как правило, каждый экземпляр одной сущности, называемой родительской сущностью, ассоциирован с произвольным (в том числе нулевым) количеством экземпляров второй сущности, называемой сущностью-потомком, а каждый экземпляр сущности-потомка ассоциирован в точности с одним экземпляром сущности-родителя.
Тип данных. Понятие тип данных в реляционной модели данных полностью эквивалентно соответствующему понятию в алгоритмических языках.
Домен. Наименьшая единица данных реляционной модели – это отдельное атомарное (неразложимое) для данной модели значение данных. Доменом называется множество атомарных значений одного и того же типа. Иными словами, домен представляет собой допустимое потенциальное множество значений данного типа.
Основной структурой хранения является отношение – таблица со следующими свойствами.
Каждый столбец содержит информацию одного типа.
Ячейки – поля – таблицы не содержат агрегатов (структур или массивов) данных.
Таблицы не содержат одинаковых строк.
Порядок строк и столбцов не имеет значения. Все операции используют содержательную сторону данных, а не их расположение внутри таблицы.
Для описания связей вводятся первичные ключи, позволяющие указывать ровно одну строку (кортеж) таблицы. Значение ключа может использоваться для ссылки в другой таблице – это использование и определяет связь двух таблиц. Поскольку первичный ключ играет ведущую роль в описании связей и поиске данных, размер ключа стараются сделать минимальным для оптимизации поиска. Это приводит к использованию номеров или кодов в качестве первичных ключей.
Для правильного связывания не должно существовать неопределенных ссылок – каждая ссылка должна указывать на определенную запись. Почти все реляционные СУБД поддерживают ссылочную целостность автоматически. Кроме ссылочной целостности должны быть определены и описаны другие ограничения и зависимости. Реляционные СУБД позволяют сделать это в виде хранимых процедур и триггеров (блоков команд запускаемых автоматически при изменении содержимого таблицы). Таким образом, реляционная модель должна включать таблицы, связи – ограничения ссылочной целостности, прочие ограничения на значения записей, а также ряд общезначимых функций, реализованных в виде процедур и триггеров и называемых бизнес-правилами [3].
СУБД Access.
Реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
- каждый элемент таблицы – один элемента данных.
- все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип и длину;
- каждый столбец имеет уникальное имя;
- одинаковые строки в столбце отсутствуют;
- порядок следования строк и столбцов может быть произвольным [9].
Строка таблицы называется записью, которой соответствует некоторый экземпляр сущности.
Столбец таблицы называется полем, представляющим собой атрибут отношений.
Ключевое поле – поле, в котором каждому значению этого поля должна соответствовать только одна запись таблицы. Ключ таблицы служит для ссылки из других таблиц на записи данной таблицы.
Свойства полей таблицы.
Имя поля. Каждое имя должно быть уникальным и иметь длину не более 64 символов. Не допускаются символы: ., !, []. Имя не должно начинаться с пробела.
Тип данных.
Текстовый <255.
Поле МЭМО – текстовые данные <64000. Для подробных комментариев.
Числовой – числовые данные для математических вычислений. Их подтипы:
а) байт – целые числа от 0 до 255 (1 байт),
б) целое – целые числа от -32768 до 32767 (2 байта),
в) длинное целое от -2 147 483 648 до 2 147 483 647 (4 байта)
г) одинарное с плавающей точкой от -3,4х1038 до 3,4х1038 с точностью до 7 знаков (4 байта)
д) двойное с плавающей точкой от ~1,797х10308 до 1,797х10308 с точностью до 15 знаков (8 байт)
Дата и время – значения даты или времени от 100 до 1999 года. (8 байт)
Денежный – при округлении не будет ошибки.
Счетчик – поле с уникальными записями.
Логический – да, нет; истина, ложь; включено, выключено. (1 бит)
Поле объекта OLE – рисунок, документы Word, документы Excel и др. до 1 Гбайт.
Гиперссылка – в нем гиперссылки.
Мастер подстановок – поле, позволяющее выбрать значения из других таблиц.
Описание – краткий комментарий, подсказки.
Первичный ключ. Может состоять из одного поля или нескольких полей.
Размер поля. Содержит максимальный размер данных сохраняемых в поле.
Формат поля – выбор типа данных. В каком виде данные можно представить на экране.
Число десятичных знаков для числового и денежного типов.
Подпись поля – вместо имени поля может быть его подпись.
Условие на значение – ограничения на вводимые значения, сообщения об ошибке.
Типы связей между таблицами. При установлении связи между двумя таблицами одна из них будет являться главной (master), а вторая – подчиненной (detail). Различие между ними несколько упрощенно можно пояснить следующим образом. В главной таблице всегда доступны все содержащиеся в ней записи. В подчиненной же таблице доступны только те записи, у которых значение атрибутов внешнего ключа совпадает со значением соответствующих атрибутов текущей записи главной таблицы. Причем изменение текущей записи главной таблицы приведет к изменению множества доступных записей подчиненной таблицы, а изменение текущей записи в подчиненной таблице не вызовет никаких изменений ни в одной из таблиц.
Различают четыре типа связей между таблицами реляционной базы данных:
один к одному — каждой записи одной таблицы соответствует только одна запись другой таблицы;
один ко многим — одной записи главной таблицы могут соответствовать несколько записей подчиненной таблицы;
многие к одному — нескольким записям главной таблицы может соответствовать одна и та же запись подчиненной таблицы;
многие ко многим — одна запись главной таблицы связана с несколькими записями подчиненной таблицы, а одна запись подчиненной таблицы связана с несколькими записями главной таблицы.
Объекты СУБД Access:
Таблица – основной объект БД, предназначенный для хранения информации.
Запросы – создаются пользователем для выборки нужных записей из одной или нескольких связанных таблиц.
Формы – предназначены для ввода, просмотра, корректировки взаимосвязанных данных на экране в удобном для пользователя виде, который может соответствовать привычному для пользователя документу.
Отчеты служат для формирования выходного документа, предназначенного для вывода на печать.
Макрос – перечень последовательно выполняемых действий – макрокоманд, выбранных из стандартного списка.
Модули – функций и процедур, записанных на языке VBA.
С точки зрения доступа к данным БД подразделяют на два вида:
- централизованные. На одном компьютере находятся ресурсы, этот компьютер называется сервером. Остальные компьютеры обращаются к серверу, они называются клиентами. Преимущества – минимальные затраты на корректировку централизованной БД. Недостатки централизованной системы – передача большого потока данных, низкая надежность, низкая производительность.
- распределенные. Части БД находятся на различных узлах сети. Устраняют недостатки централизованных БД.
Методы доступа к данным:
1. Доступ на основе архитектуры сети вида «файл-сервер». В процессе решения задач пользователя будут передаваться, кроме необходимых данных, и сопутствующие. На запрос пользователя высылается файл, содержащий необходимую информацию, которую нужно отыскать среди других данных в этом файле.
2. Доступ на основе архитектуры сети вида «клиент-сервер». Возможны следующие варианты доступа:
- доступ к удаленным данным. На компьютере клиента располагается программа, которая производит ввод исходных данных, программа, осуществляющая решение задачи на основе дополнительно поступивших из сервера данных, и программа печати результатов. На запрос пользователя передаются только требуемые данные, которые обрабатываются с помощью соответствующих программ клиента.
- доступ с помощью сервера баз данных. На компьютере клиента находятся программы ввода исходных данных и печати. Программа решения задачи находится на сервере, где и происходит ее запуск. На компьютере клиента осуществляется лишь ввод исходных данных и печать результатов.
- доступ с помощью сервера приложений. Ввод, передача, обработка и печать результатов выполняются как в предыдущей модели, за исключением того, что прикладная программа и исходные данные находятся на одном сервере, а БД – на другом.
Контрольные вопросы
Понятие информационной системы (определение, свойства).
Предметная область.
Классификация ИС.
Принципы построения ИС.
Процессы в информационной системе.
Стадии разработки ИС.
Эффективность ИС.
Риски, связанные с внедрением ИС.
Как осуществляется построение диаграмм потоков данных?
Понятие БД, СУБД.
Требования к БД.
Сущность, атрибут, ключ, кортеж, связь, домен.
Свойства полей таблицы.
Методы доступа к данным.