Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен / megababka.doc
Скачиваний:
37
Добавлен:
19.04.2013
Размер:
375.3 Кб
Скачать

>>>

  • предприятие любая деловая деятельность (банк, больница)

  • операционные данные – данные, которые отображают деятельность объектов, которые хранятся, обновляются, корректируются и т.п.

  • входные данные – могут вызывать изменения ОД, но не являются частью БД

  • выходные данные – отчеты, соображения и т.п. – получены на основе ОД – тоже не являются частью БД

  1. Традиционные технологии решения задач.

ТТ: процесс решения задачи начинается с её первоначальной постановки. Обычно это делает системный аналитик вместе с конечным пользователем. На основе этой постановки прикладной программист разрабатывает программу. Вместе с системным программистом, программа проходит отладку и сдается в эксплуатацию. По мере изменения постановки задачи в нее вносятся корректировки.

Физические данные Программа = логическая структура + методы доступа к данным + логика конкретного приложения Пользователь

Традиционная обработка данных имеет следующие недостатки:

  1. зависимость данных

  2. дублирование данных

  3. невозможность обработки нетипичных запросов

достоинства:

  1. такая технология позволяет ставить оптимальные задачи управления

  1. Современные технологии решения задач.

Идеи:

  1. привлечение конечных пользователей-управленцев – к процессам решения задачи, разработке ПО, сопровождению.

  2. отказ от универсальных программных средств (ПС)

  3. система понятий предметной области и формальной модели, положенной в основу программ, должны совпадать

  4. интерфейс пользователя – на естественном языке (или на ограниченном языке)

  5. стиль общения – таблица, анкета, метод "приказ-инструкция"

Программа = логика конкретного приложения, написанного на языке программных средств + логическая концептуальная модель предметной области + физическая модель

>>> Основные идеи новой информационной технологии воплощаются в следующих направлениях:

  1. разработка автоматизированных банков данных (АБД), где основным элементом, т.е. хранилищем для коллективного пользователя является БД (такие системы можно создать для фирм, банков и т.п.)

  2. разработка распределенных автоматизированных БД, типа Инета, т.е. система коллективного пользователя, где всемирные знания распределяются в виде распределенных БД.

  3. разработка автоматизированных банков знаний (АБЗ), систем искусственного интеллекта (ИИ).

  4. Разработка распределенных систем коллективного пользователя: АБД и БЗ.

  1. Автоматизация. Банки данных (определение, структура, функции).

Автоматизированный банк данных – АБД – человеко-машинная система математического, информационного, программного, языкового, технического обеспечения, предназначенная для централизованного накопления и коллективного многоаспектного пользования.

АБД состоит из:

  1. вычислительная система  ОС + технические средства

  2. база данных! Основное

  3. словарь данных! Основное

  4. СУБД  технический персонал

  5. группа администрирования БД

1) Информационное обеспечение

средства описания данных: классификаторы, рубрикаторы, словари кодировки/раскодировки, реляционная модель, сетевая модель, входные-выходные документы, массивы информации и т.д.

  1. ПО – ОС + СУБД + конкретные программные приложения.

  1. Система управления базой данных (СУБД).

СУБД – программный продукт, который организует систему хранения, обеспечивает средства общения с БД (запись, систематизация, упорядочивание, обновление, выборка и т.д.)

Любая СУБД состоит из:

  1. системы управления данными

  • подготовка данных

  • запоминание данных в базе

  • структуризация данных

  • добавление данных

  • стирание данных

  • изменение данных

  • реорганизация структур данных

  • восстановление структур данных

  • целостность структур данных

  1. системы доступа к данным

  • поисковая система, которая реализует поиск данных по поисковым признакам – первичным ключам

а – поиск;

б – селекция по дополнительным признакам;

в – представление данных пользователю в форме, удобной для дальнейшей обработки

  1. системы связи с юзером

а – таблицы

б – анкеты

в – "приказ – инструкция"

 все это на формализованном естественном языке.

Функции СУБД:

1 – справочная

процесс поиска и извлечения данных из базы, но осуществляется промежуточная обработка и отобранные данные формируются в виде отчетов и других форм

2 – создание БД

создание БД идет не на основе алгоритмов, а на основе смысла, т.е. семантического содержания

3 – обновление БД

м.б. корректировка всей записи, части записи, отдельных логических полей, стирание и т.п.

4 – хранение БД

основано на принципах интеграции данных, которые говорят о том, что каждая единица информации описывается 1 раз, но многократно используется различными пользователями.

5 – восстановление БД

копии БД

6 – обеспечение секретности, безопасности, целостности данных

пароли

Реализация только с помощью языковых средств:

  1. язык описания данных

описание логической структуры – полей, записей, связей между ними по правилам СУБД;

  1. язык манипулирования данными

обеспечение непосредственным доступом к данным; с помощью операторов языка можно разработать любую программу; можно открыть и закрыть базу, запомнить, найти и выдать ответ;

  1. язык пользователя

любой алгоритмический язык высокого уровня;

  1. внутренний язык

предназначен для конкретной обработки извлекаемых из базы данных в соответствии с информационными потребностями пользователя;

5. Отдел администратора БД.

Отдел АБД

Начальник ОАБД

Подотдел проектировщиков

Подотдел словарей данных

Подотдел сопровождения и эксплуатации

1) Руководитель 5) Руководитель 8) Руководитель

2) Проектировщик АБД 6) Специалист по словарям данных 9) Инженер

3) Системный аналитик 7) Техник 10) Оператор

4) Системный программист

Рис. 2

АБД реализует управление базой. Глобальная функция АБД – обеспечение структур данных и взаимосвязей между ними, эффективных для обслуживания всего коллектива пользователей.

Функции АБД:

  1. организовывать данные, связи между ними

  2. координировать все действия по проектированию, реализации и ведению БД; обновлять БД, учитывать требования юзеров

  3. расширять БД

  4. обеспечивать защиту информации от несанкционированного доступа, сбоев

  5. контролировать правильность данных, чтобы не было противоречивых данных

  6. следить чтобы обработка запросов занимала мало времени

  7. изменять если надо методы хранения, путь доступа к ним

  8. заниматься техническим обеспечением

  9. разрабатывать дополнительные программа для более удобной работы

6. Автоматизированные банки знаний (АБнЗ).

АБнЗ – система ИИ, которая предназначена для решения интеллектуальных задач, т.е. задач, где всегда есть выбор между различными альтернативами.

 

эксперт

управленец

Пользовательский интерфейс – диалоговый процессор

Блок обуч. юзера

Блок помощи

Блок объясн.

Рис. 3

  • интеллектуальный интерфейс

В интерфейсе идет преобразование запросов юзера, написанных на естественном языке на внутренний язык БнЗ. При этом в качестве внутреннего языка м.б. и логические языки, языки программирования и т.д. В современных системах используется несколько языков общения юзеров с системой:

  1. языки ограниченно-естественного плана (формализованные естественные языки) это "меню", "анкета", "приказ-инструкия"

  2. естественные языки (специализированные – язык художника, экономиста, юриста)

  • подсистема логического вывода

Из базы знаний эта подсистема получает рекомендации по решению задачи. В данной подсистеме реализуются стратегии выбора решения задачи в соответствии с правилами, заложенными в базе

  • модуль приобретния знаний

Здесь происходит отображение промежуточных и окончательных решений, и объяснение как и почему были получены эти решения

  • модуль отображения и объяснения решений

Посредством данного модуля опытные специалисты – эксперты – могут пополнять знания или же использовать узкоспециализированные знания в своих предметных областях

>>> В развитых системах различают четыре типа знаний:

  1. фактуальные знания (база фактов/данных)

  2. процедурные знания – некоторые правила использования тех или иных фактов либо на основе алгоритмов, либо на основе опыта специалистов

  3. управляющие знания – набор стратегий решений тех или иных задач

  4. метазнания – знания о знания – собирается статистика о работе, структуре, функциях своей системы + схемы рассуждения и т.д.

Режимы функционирования АбнЗ

  1. удовлетворение любого запроса юзера

  2. 1 + функции по изменению и дополнению БЗ

  3. 2 + функции объяснения

7. БД: определение, принципы организации.

"БД – совокупность операционных данных, используемых прикладными системами некоторого предприятия", К. Дэйт

БД – модель предметной области в виде семантически взаимосвязанной совокупности файлов, которые предназначены для использования любыми потребителями.

Принципы организации БД.

  1. независимость

независимость складывается из двух понятий:

  • независимость данных от программ (при изменении данных не требуется менять ПО)

  • независимость логической от физической организации данных (при изменении носителя, схемы расположения данных на физическом носителе структура не меняется, и наоборот.

  1. внутренняя интеграция данных

каждое данное, хранимое в базе описывается только 1 раз с 1 именем вне зависимости от того, сколько и какие юзеры, на каком языке они бы не общались с системой

  1. информативность данных

в БД хранится оптимальный минимум, т.е. необходимое и достаточное количество базовых данных, необходимых для расчета любых производственных данных и для удовлетворения любых запросов пользователя.

  1. удобство доступа к данным

в БД должна быть система, позволяющая юзеру, даже непрофессионалу, работать с БД

  1. поддержка БД в целостном состоянии

в БД должна быть система, которая бы проверяла значения данных на несоответствие некоторым критериям, например, диапазон значений или связь данных

  1. достоверность данных

достоверность обеспечивается за счет обновления БД

  1. безотказность и секретность

пароли

  1. открытость БД

БД должна создаваться как открытая система, по отношению к широкому классу семантических корректировок, пополнению данных, обеспечению взаимодействия различных юзеров. БД – система коллективного пользования.

  1. обеспечение взаимодействия различных пользователей

  1. перемещение данных

те данные, которые редко используются должны храниться на внешних ЗУ, а которые часто – в ОЗУ

  1. выбор рациональной системы кодирования и формализованного описания данных

созданная система должна быть закодирована, но при этом проектировщик должен выбрать такую систему кодирования, чтобы потом БД можно было рационально разместить на внешних носителях

  1. структуризация данных

в БД информация не хранимая в базе целых документов, текстов – эта информация должна быть разбита на отдельные элементы, которые затем соответствуют логическим полям. Такой подход позволяет 1) без изменения всего документа менять только некоторые данные 2) позволяет изменять запросы пользователя, которые заранее не запрограммированы

8. Архитектура БД. Взаимодействие уровней.

Для обеспечения независимости прикладных программ от данных необходимо ввести модель данных, которая будет отражать для пользователей информационное содержание БД, но подробности организации физического хранения данных в ней будут отсутствовать. Модель должна иметь свою схему, в которой отражена структура ее данных, имена записей, имена и форматы полей. Для работы с данными модели разрабатывается конкретный ЯОД и ЯМД. Запросы к данным из БД должны выражаться в прикладных программах юзеров с помощью этих языков и терминов принятой МД, т.е. прикладная программа работает только с записями модели.

Записи модели создаются системой на момент, когда они затребованы ПП, либо формируются в прикладной программе, а затем данные из этих записей переносятся в БД в хранимые записи. Для образования записей модели СУБД должна располагать информацией о том, как записи, их поля строятся соответственно из хранимых в физической базе данных (ФБД) записей и полей (и аналогично обратные преобразования при вводе данных в БД). Эта информация может быть задана АБД в виде специального описания отображения (преобразования) данных из физической базы данных в данные для принятой модели, т.е. на СУБД возлагается задача реализации отображения (прямого и обратного):

Модель  ФБД

В описании отображения кроме указания соответствий между полями записей модели и полями хранимых записей будут указаны все необходимые сведения о хранимых данных: в каком коде они представлены, как упорядочены, какие существуют индексы, где расположены те или иные данные, с какими данными они связаны, какие методы доступа необходимо использовать для манипулирования хранимыми данными и т.д.

Т.к. СУБД функционирует в среде развитых ЭВМ с мощными ОС целесообразно часть задач возложить на ОС. Обычно используют программы методов доступа ОС, а не разрабатывают отдельно.

Двухуровневая архитектура БД

Трехуровневая архитектура БД

БД – база данных

П – пользователь

МД – модель данных

ОС – операционная система

ВнМД – внутренняя модель данных

ФБД – физическая БД

РО – рабочая область

СУБД – система управления БД

ПП – прикладная программа

ВМД – внешняя МД

При проектировании СУБД разрабатывают собственные методы доступа к записям внутренней модели, базирующиеся на методах доступа ОС. Во внутренней модели БД м.б. представлена в виде совокупности хранимых файлов, для которых известна структура хранимых записей, определены служебные поля, реализующие необходимые связи между записями, известны методы доступа СУБД к этим записям и т.д. Таким образом переходим к двухуровневой архитектуре.

9. Структура данных.

В архитектуре БД различают 3 вида моделей данных: внешняя м., концептуальная м., физическая м.

Любая модель данных состоит по определению из 2х основных частей:

  1. язык описания данных (ЯОД)

  2. язык манипулирования данных (ЯМД)

Теория описания данных: в литературе структура данных определяется как набор правил и ограничений, которые отражают связи, существующие между отдельными частями данных.

Данные определяются как представление фактов и идет в формализованном виде, позволяющем передавать или обрабатывать эти данные при помощи некоторого процесса (алгоритма). В теории и практике проектирования БД структуру данных принято рассматривать на трех уровнях – на содержательном, логическом и физическом. Рассмотреть структуру данных – значит выделить атомарные единицы (неделимые по смыслу), определить связи между единицами.

На содержательном уровне изучаются конкретно смысловые значения, которые приписываются данным, т.е. проектировщик имеет дело с конкретными объектами, конкретными характеристиками, конкретными отношениями среди объектов. При этом конкретные объекты и характеристики описываются с помощью каких-то языков – на экономическом, юридическом и т.д.

Рассмотрим структуру объектов, т.е. назовем единицу информации.

На логическом уровне структура БД рассматривается как совокупность правил и ограничений, которые отражают связи, существующие между отдельными частями данных. На этом уровне имеют дело не с конкретными объектами, а с их именами, характеристиками, а ткаже с отношениями между ними.

На логическом уровне…

Общий язык описания данных

!Наименьшей единицей данного языка является элемент данных.

Это характеристика объекта или процессов, происходящих с конкретными объектами. Каждый элемент данных имеет имя и совокупность значений. Имя и совокупность значений – основные свойства элемента данных.

!Второй тип структур данных – группа. Группа – совокупность элементов данных, наприемер: работник, студент; различают простые группы и составные группы.

Различают родительские и подчиненные группы.

Иерархическоие отношение – это понимается как связь "реквизит-реквизит".

Второй вид связи "группа-реквизит"

Третий – "группа-группа"

Для того, чтобы отразить правила и ограничения связи вводится правило первичного ключа. Среди всей совокупности элементов данных определяется или 1 элемент или группа элементов, которые единственным образом идентифицируют запись или группу.

Первичный ключ может состоять из одного или нескольких элементов. Если из нескольких – это сцепленный первичный ключ.

Этот базовый набор типов структур данных определяет единицы данных, группы, иерархические отношения и т.д. 1, М, 1:1, 1:М, М:1, М:М (избавиться).

Описание структуры данных идет по т.н. схеме – она должна иметь имя; например, "Учебный процесс в ВУЗе".

Размещение элементов данных в памяти машины. При проектировании БД необходимо построить модель предметной области на ЯОД и ЯМД.

10. Модель данных (МД).

  1. МД – информационная семантическая модель объекта управления.

  2. МД – совокупность методов и средств, предназначенных для описания состояния предметной области в базах данных.

  3. МД – совокупность ЯОД и ЯМД.

 МД – семантическая модель предметной области в виде совокупности взаимосвязанных файлов, которые описаны с помощью ЯОД, и операции над ними могут проводиться с помощью ЯМД – СУБД.

При проектировании БД на различных этапах проектирования используются различные модели. Все существующие модели данных, которые могут быть использованы, можно разквалифицировать по следующим признакам:

  1. по единицам описания

  2. по операциям над данными

  3. по степени структурности

насколько модель описания данных соответствует языку описания данных СУБД

По степени структурности выделяют класс неструктурированных или малоструктурированных моделей данных и класс слабоструктурированных моделей.

Малоструктурированные – разговорная речь, например. Особенности – есть структурные компоненты, но нет правил и ограничений взаимосязи.

Слабоструктурированные – письменный язык.

Плоские модели

Иерархические модели

Сетевые модели

Реляционные модели

11. Реляционная МД БД (РлМД).

РлМД – совокупность отношений, из которых образуются новые производстенные отношения в результате выполнения запросов пользователей информационной системы.

Множества, образующие область определения отношений в РлМД, могут содержать только значения реквизитов.

Математический аппарат, позволяющий записывать структуру отношений, а также производить преобразования отношений, называется реляционной алгеброй.

Над отношениями могут быть произведены следующие операции – объединение, пересечение, вычитание, проекция, произведение, ограничение, соединение, деление и выборка.

12. Информационное пространство.

Под информационным пространством некоторого объекта или множества объектов будем понимать совокупность всех информационных компонентов этого объекта или мно­жества объектов независимо от способов и средств отобра­жения этих компонентов.

Информационное пространство неоднородно. Оно содер­жит устные и письменные сообщения, в том числе организа­ционно-распорядительскую документацию, отчеты о науч­но-исследовательских работах, экономическую, техничес­кую и конструкторскую документацию и др., сообщения на машинных носителях (перфокартах, перфолентах, маг­нитных лентах, магнитных дисках и др.), а также такие ви­ды представления информации, как звуковые, электромаг­нитные и др.

Одна из важнейших характеристик информационного пространства — степень его структурированности.

Под структурированностью понимается такое свойство информационного пространства, при котором все содержа­ние и особенности этого пространства представляются его компонентами и взаимосвязями между ними, выраженными в явном виде.

Между структурированностью информационного прост­ранства и энтропией можно провести аналогию. Энтропия — это некоторая мера неупорядоченности в информации; чем больше энтропия, тем меньше упорядоченность информации. В структурированности информационного пространства обратная зависимость — чем больше структурированность информационного пространства, тем больше его упорядо­ченность. Тем не менее аналогия между энтропией и струк­турированностью информационного пространства доста­точно глубока и позволяет переносить некоторые законо­мерности определения и изучения энтропии на структури­рованность информационного пространства.

Обработка информации на электронной вычислительной машине определяет необходимость представления ее в структурированном виде. Если в качестве меры структурирован­ности информационного пространства принять отношение объема структурированной информации к объему всей ин­формации в рассматриваемом пространстве, то степень структурированности информации, обрабатываемой на элек­тронной вычислительной машине (при условии, что эта ин­формация представляет собой рассматриваемое информа­ционное пространство, наибольшая.

В любой системе машинной обработки экономической информации все входные и выходные документы, все промежуточные и внутримашинные представления ин­формации .структурированы. Следовательно, для такого ин­формационного пространства коэффициент структурирован­ности равен или близок к максимальному значению.

В зависимости от степени структурированности информа­ционного пространства выделим следующие пять его видов.

  1. Неструктурированное информационное пространст­во (НИП). Для НИП характерно, что структурированность компонентов информации встречается редко. Примерами НИП являются разговорная речь или информация, ко­торой обмениваются между собой дельфины. Некоторые эле­менты структурированности в этом подклассе могут присут­ствовать.

  2. Слабо структурированное информационное пространст­во (ССИП) — полностью структурированы только отдель­ные крмдонентьг. Типичным примером ССИП может служить письменный язык. Структурированность основного объе­ма информации состоит в выполнении требований неко­торого синтаксиса. Как правило, такие требования неодно­значны, противоречивы, имеют исключения, сохраняют омонимию и синонимию и т. п.

  3. Структурированное информационное пространство (СИП) — характеризуется существенным преобладанием структурированных компонентов. В СИП информация до­кументирована, широко используется кодирование для обеспечения однозначности трактовки тех или иных поня­тий.

  4. Формализованно структурированное информационное пространство (ФСИП)—для него должно существовать в явном виде такое описание информационных образований, в котором определены не только информационные структуры и связи, но и алгоритмы получения значений любого элемен­та данных.

Машинно-структурированное ИП – формализованно описаны все информационные образования, в том числе формы входных и выходных документов, запросы конечных пользователей.

13. Классификация как метод структуризации.

К – метод исследования объектов путем их упорядочивания и структуризации. К – один из важнейших этапов проектирования БД. Для К необходимо определить набор классификационных признаков – основание деления. При К информации должны выполняться некоторые требования: полный охват, неперечесение выделяемых групп объектов, возможность включения новых групп, ясность К признаков, лаконичность и т.д. Различают иерархическую и многоаспектную системы К.

  • иерархическая

система многоуровневых отношений, каждый объект может попасть только в 1 классификационную группировку, отражется древовидной структурой, все в жестких рамках

  • многоаспектная

гораздо более применима на практике, т.к. предусматривает деление по нескольким признакам

также существуют дескрипторные и фасетные системы К

  • дескрипторная

базируется на использовании координатного метода индексирования информации; метод предусматривает использование дескрипторов – определенные семантические конструкции.

Пример дескрипторной классификации –УДК – универсальная десятичная классификация. Очень известна, применяется, например, так: 142.214.53 + 213434/(431) имеет значение "Справочники по радиоприемникам и телевизорам".

  • фасетная

в фасетной используются фасеты – наборы классификационных признаков. Фасетную можно считать комбинацией иерархической и многоаспектной, т.к. признаки внутри фасетов могут иметь иерархическую структуру. Фасетная система К удобна для обработки сложной логической информации

14. Документ.

Примером составное единицы информации может быть некоторое множество документированной информации – документ. Такая информация м.б. на любом носителе. Т.к. в экономике документ – основное средство регистрации отдельных фактов хозяйственной деятельности, то основным способом определения характера экономической информации является анализ содержания и структуры документа.

Форму документа можно разбить на 3 части:

  1. общую

  2. предметную

  3. оформительную

15. Экономический показатель.

Показатель – составная единица информации, состоящая из одного реквизита-основания, отражающего тот или иной факт в количественной или качественной оценке, и ряда характеризующих его и связанных с ним логическими отношениями реквизитов-признаков (времени, места, действия, действующих лиц, предметов, продуктов труда и т.д.)

Общий вид показателя м.б. представлен следующим образом: П.(Р1, Р2, Р3, Рн, КУ),

Где Рх – реквизиты-признаки, а КУ – реквизит-основание показателя.

Для показателя-массива общая формулировка включает указание длины массива (Д):

П.(1:Д).(Р1, Р2, Р3, Рн, КУ).

Одна из причин выделения показателей в особую разновидность составных единиц информации заключается в том, что показатель, по существу, является минимальной по составу информационной совокупностью, сохраняющей информативность, и поэтому достаточной для образования самостоятельного документа, который в дальнейшем может существовать даже изолированно от информационной системы, имея свою форму и свой алгоритм получения.

Структурой показателя называется его реквизитный состав.

Значение показателя – некоторая конструкция, в которой каждому реквизиту, входящему в показатель, присвоено конкретное значение из соответствующей области определения.

Для показателя определим текстовые, арифметические, логические операции и операции отношения.

  1. Арифметические

Каждый Р., входящий в показатель участвует в арифметических операциях над реквизитами, ему может быть присвоено конкретное значение.

  1. Текстовые

Р. участвуют в текстовых преобразованиях и им м.б. присвоено текстовое значение (строка).

Числовое значение для таких операций преобразуется в текст.

  1. Логические

Показатель – булева переменная.

  1. Операции отношения

Показатель рассматривается как множество значений, над которым определены операции реляционной алгебры.

16. Реквизит (Р).

Реквизит — это логически неделимый элемет любой сложной информационной совокупности, соотносимый с определенным свойством отображаемого информацией объекта или процесса. Из реквизитов компонуются все остальные, более сложные информационные конструкции. Единицы информации любой сложности можно последовательным раз­ложением на составляющие компоненты (декомпозицией) расчленить до таких составляющих — переменных вели­чин, которые не поддаются дальнейшему логическому разбиению, т.е. реквизитов. Дальнейшее членение реквизитала более мелкие составляющие — символы (символы в свою очередь — на биты, биты — на последовательность электрон­ных импульсов и т. д.) разрывает его привязку к. определенному свойству объекта (процесса), нарушает информатив­ность.

Информация отражает реальный мир с характерной для него взаимосвязью и взаимообусловленностью явлений. Поэ­тому одно и то же свойство может наблюдаться у нескольких разных, явлений (сущностей). Например, признак "дата" необ­ходим и при фиксации процесса труда, и при передаче све­дений о выполнении плана, и при отражении поступления материальных ценностей, и во многих других случаях. Бо­лее того, одно и то же значение реквизита может быть прису­ще нескольким различным по характеру сообщениям.

Например, признак "склад №3" может фигурировать в сообще­ниях о поступлении от поставщиков сырья, передаче полу­фабрикатов со склада на склад, сдаче готовой продукций, ремонте помещения, премировании работников и т, д.

Для определения понятия каждого из множества окру­жающих нас предметов, явлений необходимо найти то особенное, что отделяет его от других предметов или явлений, что выражает его внутреннюю суть. Это "особенное" пред­ставляется в виде качественных определенностей, присущих отдельным разновидностям или их группам. Многообразие форм движения материи обусловливает и многообразие форм качественной определенности.

Качественная определенность проявляется через сово­купность всех присущих понятию свойств, каждое из кото­рых конкретно выражает какую-либо его сторону, какой-либо один его момент. Вещи и явления, обладающие различ­ными свойствами (признаками), по-разному действуют на органы чувств человека и вызывают различные ощущения, благодаря чему и создается возможность их градации и индивидуализации.

Следовательно, главное назначение признаков — ука­зание тех особенностей, которыми одно явление отличается от других, т. е. индивидуализация сообщений, устранение возможностей смешения фактов и искажения информации представление таких свойств, которые могут послужить в последующем основой для обобщения.

Реквизит обладает некоторой самостоятельностью и имеет особые, характерные для него черты. Так, он может входить в самые разнообразные составные единицы информации, относящиеся к различным сущностям и имеющие различную сложность, так же, как какое-либо слово может входить в состав самых различных предложений. Это свойство реквизита находит свое отображение в его форме, всесторонне характеризующей реквизит вне зави­симости от его конкретного вхождения в ту или иную состав­ную единицу информации.

Форма реквизита включает его наименование, струк­туру (формат), значение или совокупность значений и неко­торые другие свойства.

Наименование реквизита (имя) служит для обращения к нему и обычно представляете словом или группой слов (например, "табельный номер рабочего"), названием опре­деленной графы (строки) входного или выходного доку­мента, номером, условным кодом, адресом на носителе (перфокартах, магнитной ленте, диске) или в памяти ЭВМ. При алгоритмизации и программировании с целью компактного написания чаще используют сокращенные имена— идентификаторы. Идентификаторы обычно имеют ограниче­ния надлину, используемый алфавит и сферу действия. В некоторых случаях допускается также употребление синони­мов наименований реквизита.

Целесообразно, чтобы основное имя — идентификатор реквизита — было закреплено за ним вне зависимости от того, используется ли этот реквизит етой или иной составной еди­нице информации, в той или другой подсистеме. В этом случае обеспечивается ряд преимуществ при создании БД и совместимости различных информационных систем.

Точность же обращения к конкретному реквизиту достига­ется применением уточняющих указателей. Каждому реквизиту присуще некоторое множество зна­чений в зависимости от характеристик того свойства объекта (явления), которое информационно отображает данный рек­визит. Это множество будем называть областью определения реквизита, или классом значений. Область определения, например, для параметра "температу­ра больного" одна, для признака "пол больного" - дру­гая.

Таким образом, значение реквизита является одним из элементов множества значений области определения данного реквизита, отображающей соответствующее состояние (из множества состояний) того свойства объекта (явления), ко­торое характеризует реквизит. Так, текущим значением реквизита "температура больного»"может быть "37,4", а реквизита "пол больного" — "мужской". Другими словами, значение реквизита используется для представления зна­чения соответствующего свойства сущности.

Выбор формы представления значений некоторого свой­ства сущности прямо зависит от его природы и по возможно­сти должен в максимальной мере способствовать приближению информационного отображения к естественной характеристике свойства. Так, свойству "вес груза" наиболее со­ответствует числовое представление определенного рекви­зита (в установленных единицах измерения и с заданной точностью), свойству "тип упаковки" — словесное описа­ние, а утверждение о предъявлении документов к оплате— логическое значение истинности или ложности.

Структурой реквизита называется способ представления его значения. В структуре различают длину, тип и фор­мат реквизита.

Длина реквизита есть число символов, которые образуют его значение. Длина реквизита может быть постоянной или переменной Например, значение реквизита "код цеха», как правило, является двузначным, значение реквизита "количество сданных на склад деталей" может занимать от одной до семи позиций.

Типы реквизитов зависят от видов значений. Наиболее распространены числовой, текстовой и логический типы.

Реквизиты числового типа характери­зуют количественные свойства сущностей, полученные в ре­зультате подсчета натуральных единиц, измерения взвеши­вания, вычислеяйя на основе других количественно-сум­мовых данных и т. п. Значениями таких реквизитов являются числа.

Выделяется несколько типов числовых величин в зави­симости от класса чисел, системы счисления, фиксации десятичной запятой, упаковки и других характеристик; накладываются ограничения на диапазон чисел, форматы их представления при вводе-выводе и на различных носителях даже в рамках одной реализации. Реквизиты числового типа активно используются в различных арифметических преобразованиях, а большинство из них создается в резуль­тате таких преобразований.

Особую роль играют реквизиты числового типа, прини­мающие только целочисленные значения. Такие реквизиты могут выступать в качестве реквизитов-признаков.

Реквизиты текстового типа выражают, как правило, качественные свойства сущностей и характери­зуют обстоятельства, при которых имел место научный про­цесс и были получены те или иные числовые знячения. Такие реквизиты называются признаками.

Реквизиты текстового типа могут использоваться в ка­честве операндов в арифметических и логических выражени­ях. Более того, значения таких реквизитов могут быть полу­чены в результате арифметических или логических пре­образований.

Специальными свойствами реквизитов являются признаки редактирования и преобразования, замок защиты, индика­ция наличия значения или множества значений, даты из­менения значении и др.

Реквизиты логического типа принима­ют только два значения: истинность или ложность. Используются они в логических выражениях.

17. МД "сущность-связь" – назначение, основные понятия + Тиори - Фрай

Модель типа "сущность—связь"—это неформальная модель предметной области, которая используется на этапе инфологиче­ского проектирования базы данных. Эта модель позволяет моделировать объекты ПО, взаимоотношения объектов. Относительная простота, применение естественного языка и легкость понимания позволяют использовать модель как инструмент для общения с будущими пользователями для сбора информации о предметной области для проектирования БД.

Основное назначение неформальной модели "сущность—связь" — семантическое описание предметной области и представление информации для обоснования выбора видов моделей и структур данных, которые в дальнейшем будут использованы в системе.

Существует несколько подходов к построению моделей типа "сущность—связь". Общим для всех подходов является исполь­зование трех основных конструктивных элементов для представ­ления составляющих ПО—сущность, атрибут и связь. Инфор­мация о проекте объединяется с помощью графических диаграмм. Составляющая "время" в составе конструктивных элементов в явном виде отсутствует. Время наступления событий может быть представлено в модели использованием атрибутов Например ГОД—РОЖДЕНИЯ, ДАТА—ПОСТУПЛЕНИЯ, ДАТА—ОКОНЧАНИЯ и т. д.

Сущность — это собирательное понятие, некоторая абстракция реально существующего объекта, процесса или явления, о кото­ром необходимо хранить информацию в системе. В качестве сущ­ностей в моделях ПО рассматриваются материальные (предприя­тие, изделие, сотрудники учреждения и т. п.) и не материальные (описание некоторого явления, применяемых в системе структур данных, рефераты научных статей и т. д.) объекты реальной дей­ствительности. В моделях ПО типа "сущность—связь" каждая рассматриваемая конкретная сущность является узловой точкой сбора информации об этой сущности. В модели используется также понятие "экземпляр сущности".

Тип сущности определяет набор однородных объектов, а эк­земпляр сущности—конкретный объект в наборе. Каждый рас­сматриваемый в модели тип сущности должен быть поименован.

Для идентификации конкретных экземпляров сущностей в не­котором типе используются специальные атрибуты — идентифи­каторы. Это может быть один или несколько атрибутов, значе­ния которых позволяют однозначно отличать один экземпляр сущности от другого.

Атрибут—это поименованная характеристика сущности, кото­рая принимает значения из некоторого множества значений. В модели атрибут выступает в качестве средства, с помощью ко­торого моделируются свойства сущностей. Например, для описа­ния свойств сущности КНИГА можно использовать атрибуты НАЗВАНИЕ, ФАМИЛИЯ—АВТОРА, ГОД—ИЗДАНИЯ. Чтобы задать атрибут в модели, необходимо присвоить ему наименова­ние, привести смысловое описание атрибута, определить множе­ство его допустимых значений и указать, для чего он исполь­зуется.

Основное назначение атрибута—описание свойства сущности, а также индентификация экземпляров сущностей. Например, атрибут ШИФР—ДЕТАЛИ, которому соответствует множество уникальных значений шифров деталей, позволяет однозначно идентифицировать конкретные экземпляры сущности ДЕТАЛЬ в соответствующем наборе. Атрибут можно использовать и для представления связей (отношений) между сущностями, поскольку связь (отношение) характеризует именно те объекты, между ко­торыми она существует (например, отношение ОТЕЦ—характер родства), и поэтому может выступать в роли свойства, признака сущности.

Связи выступают в модели в качестве средства, с помощью которого представляются отношения между сущностями, имею­щими место в ПО. Тип связи рассматривается между типами сущностей, а конкретный экземпляр связи рассматриваемого типа существует между конкретными экземплярами рассматриваемых типов сущностей. При анализе связей между сущностями могут встречаться бинарные (между двумя сущностями), тер­нарные (между тремя сущностями) и, в общем случае н-арные связи.

Наиболее часто встречаются бинарные связи. Для определения характера взаимосвязей между двумя типами сущностей исполь­зуются прямое и обратное отображения между двумя соответ­ствующими множествами экземпляров сущностей. Приведем клас­сификацию бинарных связей.

Отображение 1:1 (связь один-к-одному). С помощью отображения 1: 1 определяют такой тип связи между типами сущностей А и В, когда каждому экземпляру сущности А соответствует один и только один экземпляр сущно­сти В и, наоборот, каждому экземпляру сущности В соответствует один и только один экземпляр сущности А. Это означает, что один экземпляр сущности, от которого направлена связь, напри­мер А, идентифицирует один и только один экземпляр другой сущности В (к которому направлена связь) и наоборот. Иденти­фикация экземпляров сущностей уникальна в обоих направле­ниях для отображений 1:1.

Отображение 1:М (связь один-ко-многим). С помощью отображения 1:М определяется тип связи между типами сущностей А и В, когда одному экземпляру сущности А может соответствовать 0, 1 или несколько экземпля­ров сущности В, однако каждому экземпляру сущности В соответствует только один экземпляр сущности А. Это означает, что с одним экземпляром сущности А может быть связано либо не­сколько экземпляров сущности В, либо один, либо ни одного. Но при этом каждый экземпляр сущности В связан только с одним экземпляром сущности А, т. е. идентификация экземпляров при отображении 1:М уникальна только в направлении от В к А.

Отображение М:1 (связь многие-к-одному). Это отображение является обратным отображению 1:М

Отображение М:Н (связь многие-ко-многим). С помощью отображения М:N определяется тип связи между типами сущностей A и В, при котором каждому-экземпляру сущности А может соответствовать 0, 1 или несколько экземндя-ров сущности В и наоборот. С одним экземпляром сущности А может быть связано либо несколько экземпляров сущности В, либо один, либо ни одного. И наоборот, с одним экземпляром сущности В также может быть связано либо несколько экземпля­ров сущности А, либо один, либо ни одного, т. е. идентификация экземпляров сущностей неуникальна в обоих направлениях.

В некоторых случаях целесообразно рассматривать однона­правленную связь от сущности А к сущности В. В зависимости от количественных характеристик отображения различают про­стую и многозначную связь.

При простой однонаправленной связи от сущности А к сущности В одному и тому же экземпляру сущности А соответствует один и тот же экземпляр сущности В. При этом обрат­ная связь не определена. Идентификация экземпляров сущности В экземплярами сущности А—уникальна (однозначна).

При многозначной однонаправленной связи от сущ­ности А к сущности В одному и тому же экземпляру сущности А соответствует 0, 1 или несколько экземпляров сущности В. При этом обратная связь не определена. Идентификация экземпляров сущности В экземплярами сущности А не уникальна.

Связи (отношения) между сущностями специфицируются вы­ражениями реляционного вида, в которых сущности представлены своими идентифицирующими атрибутами. Во многих случаях интересен не сам факт наличия отношения между сущностями, а свойства этого отношения. Для производственно-экономических областей эти свойства определяются некоторой числовой мерой. Отношение сущностей совместно с числовой мерой этого отно­шения определяют показатель — понятие, широко используемое в управленческой деятельности.

Информацию о проекте оформляют составлением специфика­ций по сущностям, атрибутам и отношениям с использованием графических диаграмм, для этого обозначают:

типы сущностей — прямоугольниками;

атрибуты—овалами, соединяя их с соответствую­щими типами сущностей ненаправленными ребрами, идентифицирующие атрибуты подчеркиваются;

связи (отношения)—ромбами, соединяя их с соответствующи­ми типами сущностей ненаправленными ребрами, за исключением бинарных связей, которые представляются направленными реб­рами.

При моделировании используются следующие общие правила:

  • используются только три типа конструктивных элементов— сущность, атрибут, связь;

  • в отдельном проектном представлении каждый компонент информации моделируется только одним конструктивным элемен­том, т. е. необходимо избегать избыточности в использовании кон­структивных элементов.

При моделировании предметной области проектировщик раз­бивает ее на ряд локальных областей, моделирует каждое ло­кальное представление, а затем их объединяет.

18. Методические приемы ручного постороения МД «с-с» на основании списка реквизитов.

КОНЦЕПТУАЛЬНОЕ ПРОЕКТИРОВАНИЕ

Модель «сущность-связь» по Т.Тиори, Дж. Фрай.

Основными шагами проектирования, согласно методологии, описанной в книге Т. Тиори, Дж. Фрай «Проектирование структур баз данных», являются:

  1. Выбор сущностей и атрибутов

  2. Идентификация связей данных.

  3. Представление информационной структуры в графической форме.

  4. Интерпретация информационной структуры с целью ее верификации.

Основная модель

Целью данной фазы анализа является идентификация компонентов выбранной концептуальной модели данных. Используется модель «сущность-связь», что предполагает анализ следующих компонент:

Сущность – это элемент данных, который в организации служит для следующих целей:

  • для идентификации объектов

  • для создания других элементов данных

  • для ссылки на другие элементы данных

При анализе будут различаться два типа сущностей: уникальные сущности, представляемые элементом данных, который идентифицирует отдельный, отличный от других предмет или объект, и неуникальные сущности, которые образуются, если для идентификации набора элементарных данных используются две или более уникальные сущности.

Атрибуты представляются элементами данных, которые имеют смысл только в отношении с уникальными или неуникальными сущностями.

Связи представляют зависимости между двумя и более сущностями. Во время анализа могут быть выявлены три типа связей:

а. Связь типа сущность-сущность описывает квалифицируемое или неквалифицируемое отношение принадлежности между двумя сущностями.

б. Связь типа сущность-атрибут описывает элементы данных, непосредственно принадлежащие одной или более сущностям. Их принадлежность тоже может быть квалифицируемой и неквалифицируемой. Если атрибут относится только к одной сущности, принадлежность является неквалифицируемой. В квалифицируемой связи атрибут всегда принадлежит одной главной сущности и квалифицируется одной или более второстепенными сущностями.

в. Связь типа атрибут-атрибут представляет неквалифицируемое отношение принадлежности между атрибутами, которые относятся к одной и той же сущности или связи сущность-сущность.

Шаг 1. Идентификация сущностей и атрибутов.

Первая фаза анализа основана на ряде гипотез, которые были разработаны в результате анализа использования элементов данных в задачах. Эти гипотезы выглядят следующим образом:

  1. Элемент данных может являться уникальной сущностью, если:

а. Он используется в большом числе задач

б. Он используется с большим числом других элементов данных

в. Он довольно редко используется совместно с другими элементами данных по сравнению с общим числом его использования во всех задачах (это коэффициент использования)

  1. Набор из двух и более элементов данных может являться неуникальной сущностью если:

а. Каждый элемент данных из набора был вначале объявлен (или был близок к этому) как уникальная сущность.

б. Совместное использование каждого из элементов данных в составе набора встречается чаще по сравнению с отдельным использованием каждого из этих элементов данных в других задачах.

в. В тех задачах, в которых появляется этот набор элементов данных, чаще всего он используется совместно с другими элементами данных.

  1. Элемент данных может являться атрибутом, относящимся к уникальной сущности, если:

а. Он используется в относительно небольшом числе задач

б. Он используется с относительно небольшим числом других элементов данных

в. Его совместное использование с другими элементами данных по сравнению с общим числом его использования во всех задачах (коэффициент использования) является довольно частым.

  1. Элемент данных может являться атрибутом, относящимся к неуникальной сущности, если:

а. Он используется в среднем числе задач

б. Он используется со средним числом других элементов данных

в. Его совместное использование с другими элементами данных по сравнению с общим числом его использования во всех задачах (коэффициент использования) является средним.

Используя способ разбиения на интервалы, можно определить следующие граничные значения параметров:

Использование элемента данных в задачах определяется как:

  • частое, если его значение >=8

  • среднее, если его значение >1 и <=8

  • редкое, если его значение <=1

Совместное использование элемента данных с другими элементами данных

определяется как:

  • частое, если его значение >=30

  • среднее, если его значение >15 и <=30

  • редкое, если его значение <=15

Значения для коэффициента использования:

  • частое, если его значение >=75

  • среднее, если его значение >40 и <=75

редкое, если его значение <=40

Шаг 2. Идентификация связей

Целью этого этапа является идентификация трех типов связей: связи между сущностями, связи между сущностями и атрибутами, связи между атрибутами.

Для этого необходимо составить список всех уникальных и неуникальных сущностей, определенных на первой фазе анализа.

Для того, чтобы определить связь необходимо:

  1. Доказать, что связь существует на основании предложения связи.

  2. Каждая связь должна иметь уникальное имя.

  3. Определить условия существования связи или типа связи:

  • Необязательная – объявляется тогда, когда существование обоих реквизитов не зависит от связи.

  • Возможная – появляется, если существование одной из сущностей зависит от связей.

  • Условная – специальный случай возможной связи, когда между реквизитами обнаружена связь, только при определенных условиях.

  • Обязательная – появляется, если существование обоих элементов (реквизитов) зависит от связи.

Размерность связи (1:1, 1:М, М:N, М:1) . Размерность связи устанавливается на основе взаимосвязи значений реквизитов. После таких рассуждений формируем таблицу спецификаций связей реквизитов.

Шаг 3. Изображение сущностей, атрибутов и связей в графических обозначениях информационной структуры типа «сущность-связь».

Соседние файлы в папке Экзамен