- •Раздел «Базы данных» (15-45)
- •Раздел «Информационные системы»(46-60)
- •Раздел 2. Операционные системы, среды и оболочки
- •Вопросы к экзамену
- •Раздел 8. Управление информацией и ресурсами знаний в социальной сфере
- •Вопросы к экзамену
- •Раздел 9. Управление проектами информационных систем
- •Вопросы к экзамену
- •Раздел 10. Социальное проектирование и прогнозирование
- •Вопросы к экзамену
- •Типология бд: фактографические, документальные, мультимедийные; бд оперативной и ретроспективной информации. Соотношение основных требований и свойств субд: система компромиссов.
- •1. Иерархическая модель данных.
- •1. Иерархическая модель данных.
- •Декартово произведение
- •Соединение
- •Первая нормальная форма
- •Вторая нормальная форма
- •Концептуальное (инфологическое) проектирование [править]
- •Логическое (даталогическое) проектирование [править]
- •Физическое проектирование [править]
- •Инфологическое проектирование бд. Основные компоненты концептуальной модели. Преимущества использования er-моделирования. Краткая характеристика er-модели.
- •Раздел «Информационные системы»(46-61)
- •Обеспечение управления
- •Обеспечение бизнес-процессов
- •Модель сущность-связь.
- •Информационные системы как основа автоматизированных систем управления (асу). Состав асу. Основные квалификационные признаки асу. Функции асу. Виды асу. Классы структура асу.
- •Корпоративные информационные системы (кис). Общая характеристика кис. Классификация кис. Краткая характеристика модулей кис.
- •Понятие и основные характеристики программного модуля, критерии приемлемости выделенного модуля. Размер, прочность, рутинность, сцепление модуля
- •Основные характеристики программного модуля.
- •Динамические структуры данных линейные списки стеки очереди бинарные деревья
- •Основные понятия ооп: объект. Класс инкапсуляция. Наследование. Полиморфизм, абстрагирование устойчивость
- •1. Инкапсуляция
- •2. Полиморфизм
- •3. Наследовние
- •Объекты, определение, типы абстракций, используемые при построении объекта, категории объектов, интерфейс объекта.
- •Понятие класса. Управляющие предметные интерфейсные контейнерные классы. Методы классов конструктор, деструктор, аксессор, мутатор. Перегрузка классов и методов.
- •Определение термина «инкапсуляция» в языках объектно-ориентированной парадигмы программирования. Модульность. Примеры инкапсуляции.
- •Понятие события в объектно-ориентированной парадигме программирования: природа событий, виды событий, маршрутизация событий. Модификация и обработка событий. Реакция на события.
- •Обеспечение управления
- •Обеспечение бизнес-процессов
- •1 Этап. Разработка и анализ бизнес-модели
- •2 Этап. Формализация бизнес-модели. Разработка логической модели бизнес-процессов.
- •3 Этап. Выбор лингвистического обеспечения. Разработка по.
- •4 Этап. Тестирование и отладка аис.
- •5 Этап. Эксплуатация и контроль версии.
- •Жизненный цикл программного обеспечения. Понятие «жизненного цикла» ис. Модели жц ис. Стандарты, описывающие жц ис. Краткая характеристика основных процессов жц ис по стандарту (iso/iec 12207).
- •Каноническое проектирование информационных систем (ис). Определение, стадии канонического проектирования ис и их характеристика. Модель «как есть» (“as-is”). Модель «как должно быть» (“to-be”).
- •Техническое задание (тз) на разработку информационной системы. Состав и содержание технического задания (гост 34.603-89).
- •Состав и содержание технического задания (гост 34.602- 89)
- •Достоинства и недостатки тпр
- •Старшая (Precedence)
- •Потоки объектов (Object Flow)
- •Отношения (Relational Link)
- •Внутримашинное ио. Проектирование экранных форм электронных документов. Информационная база (иб) и способы ее организации.
- •Диаграмма классов (для 123. Рисовать без надписей на стрелках)
- •Диаграммах прецедентов
- •Диаграмма последовательности обработки заказа (вопр 123)
- •Кооперативная диаграмма прохождения заказа(вопр 123)
- •Физические основы вычислительных процессов. Основы построения и функционирования вычислительных машин, систем, сетей и телекоммуникаций.
- •Общие принципы построения и архитектуры вычислительных систем, сетей и телекоммуникаций. История возникновения компьютерных сетей (кс) и Интернета
- •Информационно-логические основы вычислительных систем, их функциональная и структурная организация.
- •Каналы и линии связи. Двухточечная схема передачи данных. Интерфейсы ввода вывода, терминальные устройства и оконечное оборудование кс.
- •Архитектурные особенности и организация функционирования вычислительных параллельных систем. (risc и cisc; sisd, simd, mimd).
- •Мультикомпьютеры и мультипроцессоры - типовые вычислительные структуры и программное обеспечение параллельных вс, режимы их работы.
- •Классификация вычислительных сетей. Топология сетей. Методы доступа к сети. Домашние и заводские компьютерные сети.
- •Информационное и программное обеспечение локальных проводных вс. Технические средства человеко-машинного интерфейса lan-сетей.
- •Структура и организация функционирования сетей - глобальных и региональных, проводных и беспроводных.
- •Структура и характеристики систем телекоммуникаций. Коммутация и маршрутизация.
- •Беспроводные сети – состав и технические устройства; методы доступа; стандарты и версии; программное обеспечение.
- •Цифровые каналы и сети связи, глобальные сетевые технологии. Аппаратура wan-сетей.
- •Стек протоколов Интернета. Протоколы прикладного уровня и сетевые команды.
- •Организация электронной почты. Протоколы. Сетевые команды. Почтовые серверы и клиенты.
- •Организация безопасной работы в локальной сети и Интернете. Протоколы безопасности.
- •Эффективность функционирования вычислительных систем, сетей и средств телекоммуникаций.
- •Перспективы развития вычислительных сетей и телекоммуникационных средств. Сближение локальных и глобальных технологий.
- •Общие сведения об информационных технологиях. Основные принципы, методы и свойства современных информационных технологий, их эффективность.
- •Понятие информационной системы, ее структура и состав. Примеры информационных систем.
- •Понятия компьютерной сети и арм. Классификация вычислительных сетей. Топологии вычислительной сети, преимущества и недостатки каждого типа топологии вычислительной сети.
- •Локальная вычислительная сеть, ее компоненты и особенности. Преимущества работы в локальной сети.
- •4.1. Основные компоненты
- •Рабочие станции
- •Сетевые адаптеры
- •Сетевые операционные системы
- •База данных, система управления базами данных, банк данных и компоненты автоматизированного банка данных. Классификация баз данных. Современные технологии, используемые в работе с данными.
- •Программные системы управления базами данных. Основные функции систем управления базами данных.
- •Основные функции субд
- •2.1.1. Непосредственное управление данными во внешней памяти
- •2.1.2. Управление буферами оперативной памяти
- •2.1.3. Управление транзакциями
- •2.1.4. Журнализация
- •2.1.5. Поддержка языков бд
- •Интегрированная информационная система, ее компоненты, примеры «электронных офисов».
- •Операционные системы и их атрибуты.
- •Прикладные программы.
- •Программы языковой обработки.
- •Компьютерные вирусы и вредоносные программы.
- •Понятия экспертной системы, искусственного интеллекта, интеллектуальной системы. Структура экспертной системы.
- •Структура экспертной системы
- •Базовые принципы построения сети Интернет. Что представляет собой современная структура (компоненты) Интернета? Международная система обмена информацией. Система адресации в Интернет.
- •Принципы защиты информации в Интернете. Характеристики, обеспечивающие безопасность системы.
- •Системы электронного документооборота. Системы поддержки принятия решений. Интеллектуальные системы. Цели их использования, структура
- •Система обработки данных, назначение, основные функции.
- •Автоматизированные рабочие места, основные компоненты.
1. Иерархическая модель данных.
В
иерархической модели все записи, агрегаты
и атрибуты базы данных образуют
иерархически организованный набор, то
есть такую структуру, в которой все
элементы связаны отношениями подчиненности,
и при этом любой элемент может подчиняться
только одному какому-нибудь другому
элементу.
Такую форму зависимости
удобно изображать с помощью древовидного
графа (схемы, состоящей из точек и
стрелок, которая связна и не имеет
циклов). Пример иерархической структуры
базы данных приведен на рис. 1.
Рис.
1. Схема иерархической модели данных
Типичным
представителем семейства баз данных,
основанных на иерархической модели,
является Information Management System (IMS) фирмы IBM,
первая версия которой появилась в 1968
г.
Концепция сетевой модели данных
связана с именем Ч. Бахмана.
К
основным понятиям иерархической
структуры относятся уровень, элемент
или узел и связь. Узел - это совокупность
атрибутов, описывающих некоторый объект.
На схеме иерархического дерева узлы
представляются вершинами графа. Каждый
узел на более низком уровне связан
только с одним узлом, находящимся на
более высоком уровне. Иерархическое
дерево имеет только одну вершину (корень
дерева), не подчиненную никакой другой
вершине и находящуюся на самом верхнем
(первом) уровне. Зависимые (подчиненные)
узлы находятся на втором, третьем и так
далее уровнях. Количество деревьев в
базе данных определяется числом корневых
записей.
К каждой записи базы данных
существует только один (иерархический)
путь от корневой записи.
В иерархической
модели данных автоматически поддерживается
целостность ссылок между предками и
потомками. Основное правило: никакой
потомок не может существовать без своего
родителя.
2. Сетевая модель данных.
Сетевой
подход к организации данных является
расширением иерархического. В иерархических
структурах запись-потомок должна иметь
в точности одного предка; в сетевой
структуре данных потомок может иметь
любое число предков (рис. 2).
Рис.
2. Схема сетевой модели данных
Сетевая БД состоит из набора записей и набора связей между этими записями, точнее, из набора экземпляров записей заданных типов (из допустимого набора типов) и набора экземпляров из заданного набора типов связи. Примером системы управления данными с сетевой организацией является Integrated Database Management System (IDMS) компании Cullinet Software Inc., разработанная в середине 70-х годов. Она предназначена для использования на "больших" вычислительных машинах. Архитектура системы основана на предложениях Data Base Task Group (DBTG), Conference on Data Systems Languages (CODASYL), организации, ответственной за определение стандартов языка программирования Кобол.
Примечание:
среди достоинств систем управления
данными, основанных на иерархической
или сетевой моделях, могут быть названы
их компактность и, как правило, высокое
быстродействие, а среди недостатков -
неуниверсальность, высокая степень
зависимости от конкретных данных.
3.
Реляционная модель данных.
Концепции
реляционной модели впервые были
сформулированы в работах американского
ученого Э. Ф. Кодда. Откуда происходит
ее второе название - модель Кодда.
Рис..3.
Схема реляционной модели данных
В
реляционной модели объекты и взаимосвязи
между ними представляются с помощью
двумерных таблиц (рис. 3).
Реляционная
таблица представляет собой двумерный
массив и обладает следующими свойствами:
каждый элемент таблицы — один элемент данных;
все столбцы в таблице однородные, то есть, все элементы в столбце имеют одинаковый тип (числовой, символьный или другой) и длину;
каждый столбец имеет уникальное имя;
одинаковые строки в таблице отсутствуют;
порядок следования строк и столбцов может быть произвольным.
Модель управления доступом – это структура, которая определяет порядок доступа субъектов к объектам. Для реализации правил и целей этой модели используются технологии управления доступом и механизмы безопасности. Существует три основных модели управления доступом: дискреционная, мандатная и недискреционная (также называемая ролевой). Каждая модель использует различные методы для управления доступом субъектов к объектам, каждая имеет свои преимущества и ограничения. Выбор оптимальной модели управления доступом следует производить на основе целей бизнеса и целей безопасности компании, а также на основе ее культуры и стиля управления бизнесом. Некоторые компании используют только одну модель, другие комбинируют их для получения необходимого уровня защиты.
Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.
Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.
Информация обязательно предполагает коинформацию, но информация обязательно предполагает исходно элементарное состояние информационных квантов. Информация в процессе сосуществования, синергетически вступает во взаимодействие с другими информационными квантами, каждый из которых только в универсальной взаимосвязи образует нечто определённое. Информация как универсальное многообразное по своим основаниям образует целое, составляющее коинформационное пространство.
Метаинформация есть соотносительный уровень информациональности, характеризующийся образованием как минимум двух коррелирующих слоёв информации, взаимосвязанных между собой,образующих высший уровень, зависимый от субстанционального состояния. Все формы информации, обладающие высоким уровнем сложности можно рассматривать как трансформы информационного пространства. Информация, информационное пространство в своём изменении образуют относительно устойчивые трансформы.
Слабоструктури́рованные да́нные (полуструктурированные или плохо структурированные данные) — это форма структурированных данных, не соответствующая строгой структуре таблиц и отношений в моделях реляционных баз данных, тем не менее эта форма данных содержит теги и другие маркеры для отделения семантических элементов и для обеспечения иерархической структуры записей и полей в наборе данных. . Таким образом, такой вид данных можно назвать бессхемным (schemaless), а структуру — самоописываемой.
В слабоструктурированных данных сущности, принадлежащие одному и тому же классу, могут иметь разные атрибуты, даже если классы принадлежат к одной группе. Порядок атрибутов также не важен.
Слабоструктурированные данные становятся важным объектом для исследований по нескольким причинам[2]:
к таким источникам данных, как Веб, удобно обращаться как к базам данных, но Веб нельзя «уложить» в прокрустово ложе какой-либо определённой схемы данных;
желательно иметь предельно гибкий формат для обмена данными между разными базами данных;даже при работе со структурированными данными может быть удобно представлять их в виде слабоструктурированных данных с целью навигации по ним.
Таким образом, слабоструктурированные данные встречаются всё чаще, поскольку с развитием интернета для полнотекстовых документов и баз данных требуется формат данных, выступающий в качестве информационного посредника. Слабоструктурированные данные часто можно встретить в объектно-ориентированных базах данных.
Декларативный: Ограничения целостности задаются при описании баз данных, В современных СУБД многие ограничения можно описать на ЯОД. Они хранятся в схеме данных и при работе с БД поддерживаются автоматически
Более предпочтительный способ описания по сравнению с процедурным
Процедурный: Ограничения целостности задаются в программах обработки данных
Триггеры специфицируются в схеме базы данных. Более широким понятием по отношению к Триггеру является понятие Хранимая процедура. Хранимые процедуры описывают фрагменты логики приложения, хранятся и исполняются на сервере, что позволяет улучшать характеристики производительности
Внешний уровень. На этом уровне БД описывается внешней моделью. Внешняя модель является частным представлением БД. Поэтому она включает в себя классы объектов и связей, которые соответствуют группам пользователей. Например, в БД авиалинии можно выделить следующие внешние схемы: самолет, рейс, пилот, самолет-рейс, пилот-рейс. Внешняя модель БД описывается внешней схемой, которая включает описание всех типов внешних логических записей. Внешнюю схему можно рассматривать как подсхему концептуальной схемы, однако, это не означат, что внешняя схема должна быть точной копией концептуальной схемой, либо ее части, поскольку во внешней схеме могут появляться дополнительные связи. Внутренний уровень БД. Внутренний уровень БД можно представить как совокупность наборов данных. Основными характеристиками набора данных является следующее: тип организации и метод доступа и формат внутренней записи. Отличительной особенностью БД является наличие в ней отношений между информационными объектами. Рассмотрим два основных типа реализации таких отношений. Последовательный список. Он реализует отношения для БД иерархической структуры. В этом случае один экземпляр набора и все экземпляры, подчиненные ему могут представляться в виде графа типа дерево. В памяти компьютера его можно представлять простым списком. В данном случае физическая последовательность экземпляров внутренней записи будет соответствовать их логической последовательности. Для хранения БД в этом случае могут использоваться наборы данных с последовательной организацией.
Понятие модели данных. Типология моделей данных. Иерархическая и сетевая модели (определение, логическая структура, физическое размещение, основные операции с данными, достоинства и недостатки, примеры).
В классической теории баз данных, модель данных есть формальная теория представления и обработки данных в системе управления базами данных (СУБД), которая включает, по меньшей мере, три аспекта:
1) аспект структуры: методы описания типов и логических структур данных в базе данных;
2) аспект манипуляции: методы манипулирования данными;
3) аспект целостности: методы описания и поддержки целостности базы данных.
Типы моделей, их основные отличия:фактографические, документальные, реляционные |
Основные отличия любых методов представления информации заключаются в том, каким способом фиксируется семантика предметной области. Однако следует особо отметить, что для всех уровней и для любого метода представления предметной области (нам важен контекст создания и использования машинных баз данных) в основе отображения (т. е. собственно формирования представления) лежит кодирование понятий и отношений между понятиями. |
Многоуровневая система моделей представления информации иллюстрируется рис. 1.7. |
|
Рассмотрим далее основные из них. |
Ключевым этапом при разработке любой информационной системы является проведение системного анализа: формализация той области и представление системы как совокупности цент. Системный анализ позволяет, с одной стороны, лучше понять «что надо делать» и «кому надо делать» (аналитику, разработчику, руководителю, пользователю), а с другой — отслеживать, но времени изменения рассматриваемой модели и обновлять проект. Декомпозиция как основа системного анализа может быть функциональной (построение иерархий функций) или объектной. Однако в большинстве систем, если говорить, например, о базах данных, типы данных являются более статичным элементом, чем способы их обработки. Поэтому получили интенсивное развитие такие методы системного анализа, как диаграммы потоков данных (Data Flow Diagram). Развитие реляционных баз данных в свою очередь стимулировало развитие методик построения моделей данных, и в частности, ER-диаграмм (Entity Relationship Diagram). Однако и функциональная декомпозиция и диаграммы потоков данных дают только некоторый срез исследуемой предметной области, но не позволяют получить представление системы в целом. |
Различаются и методы отображения, используемые на этапе построения даталогических моделей, отражающих способ идентификации элементов и связей, но, что особенно важно - в контексте их будущего представления в одномерном пространстве памяти вычислительной машины. |
Модели подразделяются на фактографические — ориентированные на представление хо¬рошо структурированной информации, и документальные представляющие наиболее распространенный способ отражения слабоструктурированной информации. Если в первом случае говорят о реляционной, иерархической или сетевой моделях данных, то во втором — о семантических сетях и документальных моделях. |
При проектировании информационных систем свойства объектов (их характеристики) называются атрибутами. Именно значения атрибутов позволяют выделить как в предметной области различные объекты (типы объектов), так и среди объектов одного типа — их различные экземпляры. Представление атрибутов удобнее всего моделируется теоретико-множественными отношениями. Отношение наглядно представляется как таблица, где каждая строка — кортеж отношения, а каждый столбец (домен) представляет множество значений атрибута. Список имен атрибутов отношения образует схему отношения, а совокупность схем отношений, используемых для представления БД, в свою очередь образует схему базы данных. Представление схем БД в виде схем отношений упрощает процедуру проектирования БД. Этим объясняется создание систем, в которых проектирование БД ведется в терминах реляционной модели данных, а работа с БД поддерживается СУБД одного из упомянутых ранее типов. |
Основное отличие методов представления информации заключается в том, каким способом фиксируется семантика предметной области. |
Первые, фактографические БД, задают четкую схему соответствия, в рамках которой и отображается предметная область.Подобное построение по сути своей является довольно статичным, требует априорного знания типов отношений. В нем достаточно сложно вводить информацию о новых этапах отношений между объектами, но с другой стороны, зафиксированная схема базы данных позволяет довольно эффективно организовать поиск информации. |
Во втором случае (в документальных БД) предметная среда отображается (по крайней мере, на уровне модели) в виде однородной сети, любые изменения которой, как по вводу новых классов объектов, так и новых типов отношений, не связаны с какими-либо структурными преобразованиями сети. В силу большого количества типов отношений манипулирование подобной «элементарной» информацией достаточно затруднено, поэтому для данного случая характерно введение большого количества более общих понятий (и соответствующих им отношений), что упрощает работу с сетью. |
Модель данных должна, гак или иначе, дать основу для описания данных и манипулирования ими, а также дать средства анализа и синтеза структур данных. Любая модель, построенная более или менее аккуратно с точки зрения математики, сама создаст объекты для исследования и начинает жить как бы параллельно с практикой. |
Реляционная модель данных в качестве основы отображения непосредственно использует понятие отношения. Она ближе всего находится к так называемой концептуальной модели предметной среды и часто лежит в основе последней. |
В отличие от теоретико-графовых моделей в реляционной модели связи между отношениями реализуются неявным образом,для чего используются ключи отношений. Например, отношения иерархического типа реализуется механизмом первичных/внешних ключей, когда в подчиненном отношении должен присутствовать набор атрибутов, связывающих это отношение с основным. Такой набор атрибутов в основном отношении будет называться первичным ключом, а в подчиненном — вторичным. |
Прогресс в области разработки языков программирования, связанный в первую очередь с типизацией данных и появлением объектно-ориентированных языков, позволил подойти к анализу сложных систем с точки зрения иерархических представлений - с помощью классов объектов со свойствами инкапсуляции, наследования и полиморфизма, схемы которых отображают не только данные и их взаимосвязи, но и методы обработки данных. В этом смысле объектно-ориентированный подход является гибридным методом и позволяет получить более естественную формализацию системы в целом. В итоге это позволяет снизить существующий барьер между аналитиками и разработчиками (проектировщиками и программистами), повысить надежность системы и упростить сопровождение, в частности, интеграцию с другими системами. Модель будет структурно объектно-ориентированной, если она поддерживает сложные объекты; модель будет поведенчески объектно-ориентированной, если она обеспечивает процедурную расширяемость; для того чтобы модель была полностью объектно-ориентированной, она должна обладать обоими свойствами. Разделение на фактографические и документальные в этой группе моделей является достаточно условным. Документ как последовательность полей может быть представлен в том числе и реляционной моделью. И в этом случае выбор специализированного решения чаще всего обуславливается требованием общей эффективности. |
В заключение отметим, что представленная здесь типология моделей не претендует на полноту, и она не является классификацией в точном смысле этого слова. Она скорее иллюстрирует эклектичность преобладающих в разное время взглядов, методов и решений, используемых при проектировании и реализации баз данных. |
Набор принципов, определяющих организацию логической структуры хранения данных в базе, получил название модели данных.
Модели баз данных определяются тремя компонентами: - допустимой организацией данных; - ограничениями целостности; - множеством допустимых операций. В теории систем управления базами данных выделяют модели трех основных типов: иерархическую, сетевую и реляционную. Терминологической основой для иерархической и сетевой моделей являются понятия: атрибут, агрегат и запись. Под атрибутом (элементом данных) понимается наименьшая поименованная структурная единица данных. Поименованное множество атрибутов может образовывать агрегат данных. В некоторых случаях отдельно взятый агрегат может состоять из множества экземпляров однотипных данных, или, как еще говорят, являться множественным элементом. Наконец, записью называют составной агрегат, который не входит в состав других агрегатов.
