Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
vse_BD.doc
Скачиваний:
18
Добавлен:
11.05.2015
Размер:
115.71 Кб
Скачать

1 Под информационной системой понимается организационная совокупность технических и обеспечивающих средств, технологических процессов и кадров, реализующих функции сбора, обработки, хранения, поиска, выдачи и передачи информации. Информационный процесс – процесс создания, сбора, обработки, накопления, хранения, поиска, распространения и потребления информации. Процедуры - реализующих тот или иной механизм переработки входной информации в конкретный результат.

50-60 Гг.

Основные черты этого поколения ИС - информационных систем:

- техническое обеспечение систем составляли маломощные ЭВМ 2-3 поколения. - информационное обеспечение (ИО) представляло собой массивы (файлы) данных, структура которых определялась той программой, в которой они использовались. - программное обеспечение специализированные прикладные программы, например, программа начисления заработной платы. - архитектура ИС - централизованная. Как правило, применялась пакетная обработка задач. Конечный пользователь не имел непосредственного контакта с ИС, вся предварительная обработка информации и ввод производились персоналом ИС.

Недостатки ИС - информационных систем - этого поколения:

- сильная взаимосвязь между программами и данными, то есть изменения в предметной области приводили к изменению структуры данных, а это заставляло переделывать программы. - трудоемкость разработки и модификации систем. - сложность согласования частей системы, разработанных разными людьми в разное время. 70-80 гг.

Основные черты ИС этого поколения: - основу ИО составляет база данных, - программное обеспечение состоит из прикладных программ и СУБД. - технические средства: ЭВМ 3-4 поколения и ПЭВМ. - средства разработки ИС: процедурные языки программирования 3-4 поколения, расширенные языком работы с БД (SQL, QBE). - архитектура ИС: наиболее популярны две разновидности: персональная локальная ИС, централизованная БД с сетевым доступом. Виды обеспечения информационных систем Структурно ИС включают в себя аппаратное (hardware), программное (software), коммуникационное (netware), промежуточного слоя (middleware), лингвистическое и организационно-технологическое обеспечение. Аппаратное обеспечение ИС включает в себя широкий набор средств вычислительной техники, средства передачи данных, а также целый ряд специальных технических устройств (устройства графического отображения информации, аудио- и видеоустройства, средства речевого ввода и т.д.). Аппаратное обеспечение является основой любой ИС. Программное обеспечение ИС обеспечивает реализацию функций ввода данных, их размещения на машиночитаемых носителях, модификации данных, доступ к данным, поддержку функционирования оборудования. Программное обеспечение можно разделить на системное (которое венчает процесс выбора аппаратно-программного решения, или платформы, как говорят в настоящее время) и пользовательское (которое применяется для решения задач удовлетворения потребностей пользователя в компьютерной среде, а именно, реализует бизнес-логику). Коммуникационное (сетевое) обеспечение включает в себя комплекс аппаратных сетевых коммуникаций и программных средств поддержки коммуникаций в ИС. Оно имеет существенное значение при создании распределенных ИС и ИС на основе Интернета. При создании распределенных ИС огромную роль также играет программное обеспечение промежуточного слоя, состоящее из набора программных средств (служб и сервисов), которые управляют взаимодействием распределенных объектов в системе.

Лингвистическое обеспечение ИС предназначено для решения задач формализации смыслового содержания полнотекстовой и специальной информации для создания поискового образа данных (профиля).

По мере возрастания сложности и масштабов ИС важную роль начинает играть организационно-технологическое обеспечение, которое соединяет разнородные компоненты (аппаратуру, программы и персонал) в единую систему и обеспечивает процедуры ее управления и функционирования. Недооценка этой составляющей ИС чаще всего приводит к срыву сроков внедрения системы и вывода ее на производственные мощности.

3 БД – это поименованная совокупность структурированных сведений о конкретных объектах реального мира в какой-либо предметной области. (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. Выделяют следующие основные функции СУБД: поддержка языков БД; а)управление данными во внешней памяти; б)управление буферами оперативной памяти; в)управление транзакциями; г)журнализация и восстановление БД после сбоев;

Три уровня архитектуры следующие: внутренний, концептуальный и внешний. Внутренний уровень – это уровень, определяющий физический вид базы данных, наиболее близкий к физическому хранению и связан со способами сохранения информации на физических устройствах хранения. С данным уровнем связаны дисководы, физические адреса, индексы, указатели и т.д. За этот уровень отвечают проектировщики физической БД, которые решают, какие физические устройства будут хранить данные, какие методы доступа будут использоваться для извлечения и обновления данных и какие меры следует принять для поддержания или повышения быстродействия системы управления базами данных. Пользователи не касаются этого уровня. Концептуальный уровень – структурный уровень, определяющий логическую схему базы данных. На данном уровне выполняется концептуальное проектирование базы данных, которое включает анализ информационных потребностей пользователей и определение нужных им элементов данных. Результатом концептуального проектирования является концептуальная схема, логическое описание всех элементов данных и отношений между ними.

Внешний уровень – структурный уровень БД, определяющий пользовательские представления данных. Каждая пользовательская группа получает свое собственное представление данных в БД. Каждое такое представление данных дает ориентированное на пользователя описание элементов данных, из которых состоит представление данных, и отношений между ними. Его можно напрямую вывести из концептуальной схемы. Совокупность таких пользовательских представлений данных и дает внешний уровень.

ЖЦБД состоит из следующих этапов: 1. Предварительное планирование – планирование БД, выполняемое в процессе разработки стратегического плана БД. В процессе планирования собирается следующая информация: · какие прикладные программы используются, и какие функции они выполняют; · какие файлы связаны с каждым из этих приложений; · какие новые приложения и файлы находятся в процессе работы. Данная информация помогает определить, как используется информация приложений, определить будущие требования к системе БД. Информация этого этапа документируется в виде обобщенной модели данных. 2. Проверка осуществимости. Здесь определяется технологическая, операционная и экономическая осуществимость плана создания БД, т. е.: · технологическая осуществимость – есть ли технология для реализации запланированной БД? · операционная осуществимость – есть ли средства и эксперты, необходимые для успешного осуществления плана создания БД?

· экономическая целесообразность – можно ли определить выводы? Окупится ли запланированная система? Можно ли оценить издержки и выгоду? 3. Определение требований включает выбор целей БД, выяснение информационных требований к системе и требований к оборудованию и программному обеспечению. Таким образом, на данном этапе сбора данных и определения требований создаётся общая информационная модель, выражающаяся в следующих задачах:

· Определяются цели системы путём анализа информационных потребностей. Здесь также обязательно указывается, какую именно БД следует создавать (распределённую, целостную) и какие коммуникационные средства необходимы. Выходной документ – комментарий, описывающий цели системы. · Определение пользовательских требований: документация в виде обобщённой информации (комментарии, отчёты, опросы, анкеты и т. д.); фиксация функций системы и определение прикладных систем, которые будут выполнять эти требования. Данные представляются в виде соответствующих документов. · Определение общих требований к оборудованию и программному обеспечению, связанных с поддержанием желаемого уровня быстродействия. (Выяснение количества пользователей системы, числа входных сообщений в день, количество распечаток). Данная информация используется для выбора типов компьютеров и СУБД, объёма дисков, количества принтеров. Данные этого этапа излагаются в отчёте, содержащем примерные конфигурации оборудования и программного обеспечения. · Разработка плана поэтапного создания системы, включающий выбор исходных приложений. 4. Концептуальное проектирование – создание концептуальной схемы БД. Спецификации разрабатываются в той степени, которая необходима для перехода к реализации.

Основным выходным документом является единая инфологическая модель (или схема БД на концептуальном уровне). При разработке данной модели используются информация и функции, которые должна выполнить система, определённые на этапе сбора и определения требований к системе. На данном этапе желательно также определить: 1) правила для данных; 2) правила для процессов; 3) правила для интерфейса. 5. Реализация – процесс превращения концептуальной модели в функциональную БД. Он включает в себя следующие этапы.

1) Выбор и приобретение необходимой СУБД. 2) Преобразование концептуальной (инфологической) модели БД в логическую и физическую модель данных: · на основе инфологической модели данных строится схема данных для конкретной СУБД, при необходимости реализуется денормализация БД с целью ускорения обработки запросов во всех критичных по времени приложениях;

· определяются, какие прикладные процессы необходимо реализовать в схеме данных как хранимые процедуры; · реализовать ограничения, предназначенные для обеспечения целостности данных и реализации правил для данных; · спроектировать и сгенерировать триггеры для реализации всех централизованно определённых правил для данных и правил целостности данных, которые не могут быть заданы как ограничения; · разработать стратегию индексирования и кластеризации; выполнить оценку размеров всех таблиц, кластеров и индексов;

· определить уровни доступа пользователей, разработать и внедрить правила обеспечения безопасности и аудита. Создать роли и синонимы для обеспечения многопользовательского доступа с согласованными уровнями полномочий доступа. · разработать сетевую топологию БД и механизм бесшовного доступа к удалённым данным (реплицированная или распределённая БД). 3) Построение словаря данных, который определяет хранение определений структуры данных БД. Словарь данных также содержит информацию о полномочиях доступа, правилах защиты данных и контроля данных. 4) Заполнение базы данных.

5) Создание прикладных программ, контроль управления.

6) Обучение пользователей. 6. Оценка и усовершенствование схемы БД. Включает опрос пользователей с целью выяснения функциональных неучтенных потребностей. При необходимости вносятся изменения, добавление новых программ и элементов данных по мере изменения и расширения потребностей.

4 Модель данных – это некоторая абстракция, которая, будучи приложима к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, т.е. сведения, содержащие не только данные, но и взаимосвязи между ними. Иерархическая модель Основополагающей логической структурой для данной модели является ориентированное дерево с корнем. Вершины дерева соответствуют интересующим нас объектам, а дуги – связям между объектами. Все вершины дерева, за исключением корня, должны иметь предка. Между двумя вершинами может быть только одна связь. Иерархическая модель поддерживает связи “один к одному” и “один ко многим” и “многие ко многим”.

К достоинствам иерархической модели относятся эффективное использование памяти ЭВМ, неплохие показатели времени выполнения основных операций над данными, удобство работы с иерархически упорядоченной информацией. Недостатками иерархической модели являются невозможность хранения экземпляров записей, не имеющих родительских записей, трудность реализации связей “многие ко многим” и других более сложных иерархических связей. Сетевая модель Сетевой подход организации данных является расширением иерархического. В иерархической модели запись-потомок должна иметь в точности одного предка; в сетевой модели запись-потомок может иметь любое число предков. Для реализации иерархической структуры используются две группы типов – тип записи и тип набора. К достоинствам сетевой модели относится возможность установления произвольных связей между записями. Недостатком сетевой модели является высокая сложность схемы базы данных. Сложность сетевых и иерархических моделей объясняется тем, что они построены с использование внутренних физических указателей, связывающих записи между собой.

Реляционная модель Реляционная модель была разработана доктором Э.Ф. Коддом в начале 70-х годов прошлого века. Как уже отмечалось, любая база данных состоит из описаний объектов некоторой предметной области, а также содержит информацию о взаимосвязях между объектами. Тип объекта называется сущностью, а характеристики объектов их атрибутами. Достоинствами реляционной модели являются простота, наглядность, независимость от данных. К тому же, в отличие от сетевых и иерархических моделей, реляционные модели для организации связей между записями применяют не внутренние указатели, а фактические значения атрибута, используя общий атрибут в каждой из записей. Недостатки реляционной модели связаны с однородностью структуры данных, семантической перегруженностью модели, ограниченным набором операций. Объектно-ориентированная модель

Объектно-ориентированная модель данных учитывает семантику объектов, применяемую в объектно-ориентированном программировании. Основными модельными понятиями являются объекты и литералы. Объект обладает уникальным идентификатором, который не изменяется и не используется после удаления объекта. Объекты могут быть разбиты на типы: атомарные, коллекции или структурированные типы. Достоинствами объектно-ориентированной модели является улучшенные возможности моделирования объектов реального мира. Объектные типы данных, а также объектные таблицы представляют мощный единый уровень интерпретации объектов деловой сферы и позволяют отказаться от деления на части бизнес-данных для хранения их в БД при использовании реляционной модели.

Недостатками модели является высокая понятийная сложность, отсутствие стандарта объектно-ориентированной модели из-за недостаточной её теоретической разработки. Объектно-реляционная модель В связи с не разработанностью объектно-ориентированной модели, на практике применяется объектно-реляционная модель, являющаяся как бы смесью реляционной и объектно-ориентированной методологий для представления данных. Эта модель представляет собой расширенную реляционную модель, в которой сняты ограничения неделимости данных, хранящихся в записях таблиц.

Преимуществом объектно-реляционной модели является возможность использования существующих реляционных баз данных с вновь разрабатываемыми объектными приложениями.

К недостаткам модели можно отнести сложность решения проблемы обеспечения целостности и непротиворечивости хранимых данных.

Многомерная модель Многомерная модель данных является узкоспециализированной моделью, предназначенной для оперативной аналитической обработки информации. Основным достоинством многомерной модели данных является удобство и эффективность аналитической обработки больших объемов данных, связанных со временем. Недостатком многомерной модели является ее громоздкость для простейших задач обычной оперативной обработки данных.

Своиства реляционной модели: А)ключевой столбец не может содержать неопределенное значение (определитель NULL);

Б)для связанных таблиц каждой строке основной таблицы соответствует нуль или более строк подчиненной таблицы; В)для связанных таблиц в подчиненной таблице нет строк, не имеющих родительских строк в основной таблице; Г)для связанных таблиц каждая строка подчиненной таблицы имеет только одну родительскую строку в основной таблице.

5.Реляционная модель основана на математическом понятии отношения, физическим представлением которого является двумерная таблица, состоящая из строк одинаковой структуры. Тип объекта называется сущность , а характеристики объектов их атрибутами.

Набор атрибутов, однозначно определяющий каждый объект, называют ключом. Атрибут можно рассматривать как переменную, принимающую значения из некоторого множества значений, называемого доменом атрибута. Множество корежей R называют отношением, а количество атрибутов n – арностью отношения. Количество содержащихся в отношении кортежей называется кардинальностью отношения.

Любая таблица имеет один или несколько столбцов, значения которых однозначно идентифицируют каждую ее строку. Такой столбец (или совокупность столбцов) называется первичным ключом. Взаимосвязи таблиц в реляционной модели поддерживаются внешними ключами. Внешний ключ – это столбец (или совокупность столбцов), значения которого однозначно характеризуют сущности, представленные строками некоторого другого отношения, т.е. задают значения их первичного ключа.

Вопрос№9 Инфологическая модель баз данных.

Основным выходным документом является единая инфологическая модель (или схема БД на концептуальном уровне). При разработке данной модели используются информация и функции, которые должна выполнить система, определённые на этапе сбора и определения требований к системе. На данном этапе желательно также определить: 1) правила для данных; 2) правила для процессов; 3) правила для интерфейса. Диаграмма: Сущность изображается на ER-диаграмме в виде прямоугольника, в верхней части которого приводится ее название; далее следует список атрибутов. Ключевые атрибуты могут быть выделены подчеркиванием или иным способом. Связь изображается на ER-диаграмме линией, проводимой между сущностью-родителем и сущностью-потомком с точкой на конце линии у сущности-потомка. идентифицирующая связь изображается сплошной линией, неидентифицирующая - пунктирной. Связь представляется в виде линии, соединяющей 2 сущности, при этом в месте соприкосновения связи с сущностью используется множест­венный вход в прямоугольник, если для связи могут использовать несколь­ко элементов, и единичный - если в связи может участвовать только один элемент сущности. Обязательность связи изображается перпендикуляром, а необязательность - окружностью. Преобразование ER-модели в реляционную схему осуществляется в соответствии со следующими правилами: 1/каждая простая сущность превращается в отношение. Имена отношений могут отличаться от имен сущностей, так как могут быть ограничены требованиями конкретной СУБД; 2/каждый атрибут становится возможным столбцом с тем же именем, для каждого атрибута задается допустимый тип данных и обязательность или необязательность этого атрибута; 3/компоненты уникального идентификатора сущности превращаются в первичный ключ отношения; 4/в каждое отношение, соответствующее подчиненной сущности, добавляется набор атрибутов основной сущности, являющейся первичным ключом основной сущности. В отношении, соответствующем подчи­ненной сущности, этот набор атрибутов становится внешним ключом.

5/Для связи М:М используется специальный механизм преобразований, кото­рый позволяет отразить множественные связи, неспецифичные для реляцион­ной модели. Это делается введением дополнительного связующего отноше­ния, которое связано с каждым исходным связью 1 :М, атрибутами этого свя­зующего отношения являются первичные ключи связываемых отношений. При этом каждый из атрибутов нового отношения является внешним клю­чам, а вместе они образуют первичный ключ новой связующей сущности. Спроектируем инфологическую модель системы, предназначенной для компании, которая занимается продажей объектов недвижимости.

Вопрос№8 Нормализация баз данных. Последовательность нормальных форм.Классическая технология проектирования реляционных БД связана с теорией нормализации, основанной на анализе функциональных зависимостей между атрибутами отношений. Функциональные зависимости определяют устойчивые отношения между объектами и их свойствами в рассматриваемой предметной области. Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений. Примером набора ограничений является ограничение первой нормальной формы - значения всех атрибутов отношения атомарны. В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм: 1 первая нормальная форма (1NF); 2 вторая нормальная форма (2NF); 3 третья нормальная форма (3NF); 4 нормальная форма Бойса-Кодда (BCNF); 5 четвертая нормальная форма (4NF); 6 пятая нормальная форма, или нормальная форма проекции-соединения (5NF или PJ/NF). Основные свойства нормальных форм: каждая следующая нормальная форма в некотором смысле лучше предыдущей; при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются.

10.1. Система управления базами данных (СУБД) – это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации. Выделяют следующие основные функции СУБД: 1)поддержка языков БД; 2)управление данными во внешней памяти; 3)управление буферами оперативной памяти; 4)управление транзакциями; 5)журнализация и восстановление БД после сбоев; 10.2 Типы СУБД: -настольные; -серверные 10.3 Файл-серверные базы данных отличаются от автономных баз данных тем, что могут быть доступны многим клиентам через сеть. Сама база данных хранится на сетевом файл-сервере в единственном экземпляре. Для каждого клиента во время работы создается локальная копия данных, с которой он манипулирует. При этом обеспечивается возможность одновременного доступа нескольких пользователей к одной и той же информации. Одним из недостатков баз данных файл-сервер является непроизводительная загрузка сети. При каждом запросе клиента данные в его локальной копии полностью обновляются из базы данных на сервере. Клиент-серверные базы данных обычно используются в сложных многопользовательских системах обработки данных. В этом случае доступ к базе данных для группы клиентов выполняется специальным системным процессом – сервером. Клиент, прикладной процесс, дает задание серверу выполнить те или иные операции поиска и обновления базы данных. И мощный сервер, ориентированный на операции с запросами самым оптимальным способом, выполняет их и сообщает клиенту результаты своей работы. Напрямую к базе данных клиент доступа не имеет. Многоуровневые распределенные базы данных В последнее время данный тип организации получил преимущественное распространение. При работе с такой базой данных используемое программное обеспечение группируется по трем уровням. 1/ На нижнем уровне на компьютерах пользователя расположены приложения клиентов, обеспечивающие пользовательский интерфейс. 2/ На втором уровне расположен сервер приложений, обеспечивающий обмен данными между пользователями и распределенными базами данных. Сервер приложений размещается в узле сети, доступном всем клиентам и выполняет все действия, связанные с реализацией бизнес-логики приложений. 3/ На третьем уровне расположен удаленный сервер баз данных, принимающий информацию от серверов приложений и управляющий ими, а также реализующий доступ к базе данных. В зависимости от используемой логической модели данных СУБД делятся на иерархические, сетевые, реляционные и т.д. Автономные базы данных простые базы данных, хранящие свои данные в локальной файловой системе на том компьютере, на котором они установлены. Система управления, осуществляющая к ним доступ, находится на том же самом компьютере. Сеть практически не используется.

2 Информационно-поисковые системы – совокупность средств, предназначенных для: хранения больших объемов информации; быстрого поиска требуемой информации; добавление, удаление и изменение хранимой информации; вывода информации в удобном для человека виде. Поисковые системы различают: автоматизированные, библиографические, диалоговые, документальные и фактографические(четотамвтабл). В работе поисковый процесс представлен 4-мя стадиями:

1)формулировка;

2)действие;

3)обзор результатов;

4)усовершенствование результатов поиска;

Информационно-справочные системы – используется для хранения и обработки справочной информации. Возможности: хранит большие объемы информации, структурирована отображать хранимую информацию, быстрый поиск нужных документов или их фрагментов в огромных массивах данных.

Информационно-управляющие системы. Предназначены для: распределения ресурсов и контроль их состояния; оперативного планирования(графики производственных заданий); диспетчеризация производства(выдача распоряжений по пуску \ остановке технологического оборудования, распределения сырья); для управления документами (выдача рабочих инструкций, накладных и др документов); сбора данных по текущим состояниям производственных ресурсов; управление трудовыми ресурсами; управление качеством; управление техн. обслуживанием; анализ выполнения.

Эспертные системы – это вычислительная система, в которую включены знания специалистов о некоторой узкой предметной области.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]