
- •Список вопросов:
- •Понятие бд. Предметная область. Роль баз данных(бд) в автоматизированных системах. Архитектура бд и системы с бд.
- •Уровни описания и представления данных. Концептуальная , внешняя, внутренняя(логическая) и физическая схема данных.
- •Система управления базами данных(субд) и роль операционной системы.
- •7. Обеспечение логической целостности бд.
- •8. Обеспечение физической целостности данных.
- •9. Управление доступом.
- •10. Настройка субд.
- •Модель данных, факты, данные, информация, знания , единица(элемент) данных. Понятие модели данных. Правила порождения структур данных и ограничений целостности.
- •Язык описания данных. Операции. Язык манипулирования данными. Модель данных «сущность-связь».
- •Структура данных. Интенсиональное и экстенсиональное описание множества данных. Множество. Домены и атрибуты. Декартово произведение и математическое отношение.
- •Кортеж как агрегат данных. Сущность - отношение, определенное на доменах. Связь - отношение, определенное на сущностях.
- •Понятие отношения
- •Виды связей - унарная, бинарная, n-арная. Кардинальные числа и виды отображений - полные, неполные, однозначные, многозначные, функциональные.
- •Дисциплина--------------Расписание (ас) -----------Преподаватель Аудитория-----------------| | |-----------------Группа Пара-------------------------|
- •1. Отображение без ограничений.
- •4. Полное функциональное отображение.
- •6. Отображение один к одному частичное.
- •7. Отображение один к одному полное.
- •Оптимизация структуры данных. Понятие ключа отношения. Первичный и вторичный ключ. Транзитивные, неполные функциональные и многозначные зависимости атрибутов.
- •Нормализация: первая, вторая, третья, четвертая нормальные формы.
- •Операции. Навигационные и спецификационные операции. Действия над данными.
- •Виды и способы селекции данных. Алгебра отношений. Объединение, пересечение, разность, проекция, соединение.
- •Ограничения целостности. Определение и классификация. Ограничения на операции. Ограничения на значения атрибутов. Семантическая целостность. Агрегатные ограничения. Свойства ограничений.
- •Сетевая модель данных. Сеть, вершины, дуги.(направление, ненаправленные), циклы, петли.
- •Иерархическая модель данных. Отношение «исходный - порожденный». Дерево, корень, листья, узлы(исходные, порожденные), дуги, путь. .
- •Реляционная модель данных. Таблица, заголовок, столбцы, строки. Способы логической реализации связей в реляционной модели.
- •Понятия физической организации: файл, набор, запись, поле записи, ключ. Организация файлов. Проблемы физического представления.
- •Способы адресации и поиска: двоичный, блочный, индексации и сортировка, индексно-последовательный, рандомизированный.
- •Способы представления связей, типы указателей, цепи, кольца. Представление древовидных структур.
- •Жизненный цикл бд. Фаза анализа и проектирования. Инфологическое и даталогическое проектирование. Концептуальное, логическое и физическое проектирование.
- •Создание отчетов
- •Формулирование сущностей, определение атрибутов, выбор и формирование ключа, спецификация связей. Фаза реализации и эксплуатации.
- •Виды связей:
- •1. Рекурсивная (петля). Преподаватель – сс, связь – руководит (1:n). Связи: Преподаватели:
- •Дисциплина--------------Расписание (ас) -----------Преподаватель Аудитория-----------------| | |-----------------Группа Пара-------------------------|
- •Загрузка и документирование бд. Анализ функционирования и поддержка. Модернизация и адаптация.
- •Выбор субд. Факторы, влияющие на выбор. Основные субд, представленные на рынке программного обеспечения: Clipper, dBase, Oracle, paradox, Access, стандарты codasyl и sql.
- •Перспективы развития технологии хранения и распространения данных. Глобальные(всемирные) распределенные бд. Современные интеллектуальные средства создания и поддержки бд.
Оптимизация структуры данных. Понятие ключа отношения. Первичный и вторичный ключ. Транзитивные, неполные функциональные и многозначные зависимости атрибутов.
Структура данных - атрибутивная форма представления свойств и связей предметной области, ориентированная на выражение описания данных средствами формальных языков и т.о. учитываются возможности и ограничения конкретных средств, с целью сведения описаний к стандартным типам и регулярным связям. Структура данных с т.з. программирования – это способ отображения значений в памяти – размер области и порядок ее выделения(который и определит характер процедуры адресации – выборки.)
Оптимизация структур баз данных с учетом требований к достоверности данных
Эффективность и надежность функционирования автоматизированных информационно–управляющих систем (АИУС) существенно зависит от достоверности данных, содержащихся в базах данных (БД). Анализ факторов, влияющих на качество и эффективность процессов проектирования и эксплуатации БД, позволяет выделить следующие их характерные особенности, которые определяют специфику исследования вопросов обеспечения достоверности информации: наличие большого количества пользователей и решаемых ими задач с различными требованиями к достоверности данных; хранение в БД большого объема разнородной информации, требующей эффективных мер по обеспечению целостности и достоверности хранимых данных; усложнение структур хранения и доступов к данным; хранение в БД как собственно данных, так и связей (отношений) между ними, что обусловливает необходимость комплексного рассмотрения проблемы повышения достоверности информации в БД; обеспечение возможности параллельного доступа пользователей к данным.
Необходимый уровень достоверности данных БД может быть достигнут как структурными методами, обеспечивающими анализ и синтез оптимальных канонических, логических и физических структур БД, так и применением определенных механизмов и систем повышения достоверности данных в БД. В работе предложены аналитические выражения для определения достоверности структур данных при отображении предметной области АИУС в каноническую структуру БД, канонической структуры БД – в логическую, логической структуры БД – в физическую структуру, а также определения достоверности хранимой в БД информации. Разработан комплекс моделей и методов синтеза оптимальных логических и физических структур БД по критериям эффективности, коррелированным с требованиями достоверности данных. К ним относятся: минимум числа точек входа и числа альтернативных путей доступа к данным; минимум суммарной длины путей доступа к искомым данным; максимум достоверности хранения и обработки данных. Поставлена и решена задача выбора оптимальных методов контроля данных.
Результатами решения поставленных задач являются оптимальные с учетом требований к достоверности данных логические и физические структуры БД (состав и структуры логических записей и связей, структуры размещения в памяти ЭВМ и др. характеристики), а также производится выбор оптимальных методов контроля данных в физической структуре БД.
Первичный ключ (ПК) – одно или несколько полей, однозначно идентифицирующих запись. Если первичный ключ состоит из одного поля, он называется простым, если из нескольких – составным ключом. Вторичный ключ (ВК) – поле, значение которого может повторяться в нескольких записях файла, т.е. он не является уникальным. Если по значению первичного ключа может быть найдет один единственный экземпляр записи, то по вторичному – несколько. Название структуры данных используется в ряде СУБД, что делает эти понятия в определенном смысле универсальными. Индексирование – средство эффективного доступа по ключу к записям. При индексировании создается дополнительный индексный файл, который содержит в упорядоченном виде все значения ключа файла данных. Для каждого значения ключа в индексном файле содержится указатель на соответствующую запись файла данных. При наличии индексного файла, размеры которого меньше основного файла, по заданному ключу быстро отыскивается запись. С помощью указателя на запись в файле данных осуществляется прямой доступ к этой записи. Индексирование может производиться не только по первичному ключу, но и по вторичному.Реляционная модель представляет собой базу данных в виде множества взаимосвязанных отношений. В каждой связи одно отношение может выступать как основное, а другое отношение выступает в роли подчиненного. Таким образом, один кортеж основного отношения может быть связан с несколькими кортежами подчиненного отношения. Для поддержки этих связей оба отношения должны содержать наборы атрибутов, по которым они связаны. В основном отношении это первичный ключ отношения, который однозначно определяет кортеж основного отношения. В подчиненном отношении для моделирования связи должен присутствовать набор атрибутов, соответствующий первичному ключу основного отношения. Однако здесь этот набор атрибутов уже является вторичным ключом или внешним ключом, т.е. он определяет множество кортежей отношения, которые связаны с единственным кортежем основного отношения.
Один из способов структуризации данных является использование абстракций. Абстракция - совокупность предметов или их деталей, которые можно рассматривать как единое целое. Абстрагирование позволяет рассмотреть в объектах и окружающем мире только существенное, опуская детали. Классификация: 1. Обобщение (классификация, обобщение). 2. Агрегация. Обобщение используется для образования новых категорий данных. Агрегация позволяет на основе одних категорий данных, создавать новые, более общие. Объект – конкретный экземпляр. Класс – множество подобных объектов. 1)Обобщения: Классификация, Обобщение. Процесс выражения класса через объект или класс называется обобщением. Классификация – выражение класса через объект (обратно – экземпляризация). Обобщение – выражения класса через класс (обратно – специализация)
2)Иерархия агрегации:
Пример: Агрегат – автомобиль; Способы агрегирования – марка бензина, стоимость автомобиля, владелец автомобиля.
Поле В таблицы функционально зависит от поля А той же таблицы в том и только в том случае, когда в любой заданный момент времени для каждого из различных значений поля А обязательно существует только одно из различных значений поля В. Отметим, что здесь допускается, что поля А и В могут быть составными. Полная функциональная зависимость. Поле В находится в полной функциональной зависимости от составного поля А, если оно функционально зависит от А и не зависит функционально от любого подмножества поля А.
Многозначная зависимость. Поле А многозначно определяет поле В той же таблицы, если для каждого значения поля А существует хорошо определенное множество соответствующих значений В. Транзитивная зависимость: Если А→В→С, то А→С – транзитивная зависимость.