- •Базы данных, знаний и экспертные системы
- •1.1 Достоинства централизованного управления.
- •1.2 Цели использования БД
- •1.3 Многоуровневая структура БД.
- •1.3.1 Обобщенный алгоритм работы СУБД
- •2 Физический уровень. Требования. Размещение. Сжатие
- •2.1 Введение
- •2.2 Возможные представления данных
- •2.3 Интерфейс физических записей: методы индексирования
- •2.4 Общие методы индексирования
- •3 ИНДЕКСНО-ПОСЛЕДОВАТЕЛЬНАЯ ОРГАНИЗАЦИЯ
- •3.1.1 ПОСЛЕДОВАТЕЛЬНАЯ ИЛИ ПРОИЗВОЛЬНАЯ ОБРАБОТКА?
- •3.1.2 ВЕДЕНИЕ ФАЙЛА
- •3.1.3 СВЯЗЬ С ТЕХНИЧЕСКИМ ОБЕСПЕЧЕНИЕМ
- •3.1.5 МНОГОУРОВНЕВОЕ ИНДЕКСИРОВАНИЕ
- •3.1.6 ВИРТУАЛЬНЫЙ МЕТОД ДОСТУПА (VSAM)
- •3.1.7 ВКЛЮЧЕНИЕ И УДАЛЕНИЕ ЗАПИСЕЙ
- •4 ОРГАНИЗАЦИЯ ОБЛАСТИ ПЕРЕПОЛНЕНИЯ
- •4.1 РАСПРЕДЕЛЕННАЯ СВОБОДНАЯ ПАМЯТЬ
- •4.2 РАСЩЕПЛЕНИЕ ПАМЯТИ
- •4.2.1 РАЗМЕЩЕНИЕ ИНДЕКСОВ
- •5 Алгоритмы перемешивания
- •5.1 ФАКТОРЫ, ВЛИЯЮЩИЕ НА ЭФФЕКТИВНОСТЬ ПЕРЕМЕШИВАНИЯ
- •5.1.1 РАЗМЕР УЧАСТКА ЗАПИСЕЙ
- •5.1.2 ПЛОТНОСТЬ ЗАПОЛНЕНИЯ
- •5.2 АЛГОРИТМЫ ПЕРЕМЕШИВАНИЯ
- •5.2.1 Метод квадратов
- •5.2.2 Деление
- •5.2.3 .Сдвиг разрядов
- •5.2.4 Складывание
- •5.2.5 . Анализ отдельных разрядов ключа
- •5.2.6 . Преобразование основания системы счисления
- •5.2.7 . Метод Лина
- •5.2.8 . Деление полиномов
- •5.3 ВЫБОР АЛГОРИТМА ПЕРЕМЕШИВАНИЯ
- •5.4 ЗАМЕЧАНИЯ ПО РЕАЛИЗАЦИИ АЛГОРИТМОВ ПЕРЕМЕШИВАНИЯ
- •5.4.1 РАЗМЕЩЕНИЕ ЗАПИСЕЙ В ОБЛАСТИ ПЕРЕПОЛНЕНИЯ
- •5.4.2 ОПТИМИЗАЦИЯ
- •6.1 Физическое представление древовидных структур
- •6.1.1 Усложненный двумерный файл
- •6.1.2 ГЛАВНЫЙ И ДЕТАЛЬНЫЙ ФАЙЛЫ
- •6.1.3 МНОГОУРОВНЕВЫЕ ДЕРЕВЬЯ
- •6.1.4 Метод 1. Физически последовательное размещение
- •6.1.5 Метод 2. Левосписковые структуры с переполнениями
- •6.1.6 Метод 3. Левосписковые структуры с распределенной свободной памятью
- •6.1.7 ПОСЛЕДОВАТЕЛЬНЫЕ ФАЙЛЫ
- •6.1.8 Метод 4. Множественные указатели на порожденные записи
- •6.1.9 Метод 5. Указатели на подобные и порожденные записи
- •6.1.10 УКАЗАТЕЛИ НА ИСХОДНЫЕ ЗАПИСИ
- •6.1.11 Метод 6. Кольцевые структуры
- •6.1.12 ВКЛЮЧЕНИЕ И УДАЛЕНИЕ ЗАПИСЕЙ
- •6.1.13 Метод 7. Справочники деревьев
- •6.1.14 Метод 8. Битовые отображения
- •6.1.15 СМЕШАННЫЕ МЕТОДЫ
- •6.2 Физическое представление сетевых структур
- •6.2.1 ФИЗИЧЕСКИ ПОСЛЕДОВАТЕЛЬНОЕ РАЗМЕЩЕНИЕ
- •6.2.2 ВСТРОЕННЫЕ УКАЗАТЕЛИ
- •6.2.3 СЛОЖНЫЕ СЕТЕВЫЕ СТРУКТУРЫ
- •6.2.4 МНОГОУРОВНЕВЫЕ СЕТЕВЫЕ СТРУКТУРЫ
- •6.2.5 СПРАВОЧНИКИ
- •6.2.6 БИТОВЫЕ ОТОБРАЖЕНИЯ
- •7 . Построение индекса
- •7.1 ОПЕРАЦИИ ПОИСКА
- •7.2 ФОРМЫ ПРЕДСТАВЛЕНИЯ ФУНКЦИИ
- •7.2.1 Адрес записи
- •7.2.2 Относительный адрес записи
- •7.2.3 Символический адрес записи
- •7.2.4 Адрес размещения участка записей
- •7.2.5 Адрес цепи
- •7.2.6 Значения атрибута
- •7.2.7 Несколько выходов
- •7.3 ФУНКЦИИ С КОНЕЧНЫМ ЧИСЛОМ ЗНАЧЕНИЙ
- •7.4 ИНДЕКС С НЕСКОЛЬКИМИ ФУНКЦИЯМИ
- •7.4.1 АРГУМЕНТ
- •7.5 КАКИЕ АТРИБУТЫ СЛЕДУЕТ ИНДЕКСИРОВАТЬ?
- •7.6 СЖАТИЕ КЛЮЧА
- •8 Поиск по нескольким ключам
- •8.1 Первичный и вторичный ключ
- •8.2 Пример БД с несколькими ключами
- •8.3 РАЗМЕЩЕНИЕ ЗАПИСЕЙ НА ФИЗИЧЕСКИХ НОСИТЕЛЯХ ДАННЫХ
- •8.3.1 ЗАПИСИ, СВЯЗАННЫЕ В ЦЕПЬ
- •8.3.2 ФАЙЛ С НЕСКОЛЬКИМИ ВТОРИЧНЫМИ КЛЮЧАМИ
- •8.3.3 СЧЕТЧИК ДЛИНЫ ЦЕПИ
- •8.3.4 МУЛЬТИСПИСКОВАЯ ОРГАНИЗАЦИЯ
- •8.3.5 ОРГАНИЗАЦИЯ ФАЙЛА И АППАРАТНОЕ ОБЕСПЕЧЕНИЕ
- •8.3.6 СЕКЦИОННЫЕ ЦЕПИ
- •8.3.7 ПАРАЛЛЕЛЬНЫЕ СЕКЦИОННЫЕ ЦЕПИ
- •8.3.8 ИНВЕРТИРОВАННЫЕ СПИСКИ
- •8.3.9 КОСВЕННЫЙ ИНДЕКС
- •8.3.10 СЕКЦИОННЫЕ ИНВЕРТИРОВАННЫЕ СПИСКИ
- •8.3.11 ПАРАЛЛЕЛЬНЫЕ СЕКЦИОННЫЕ ИНВЕРТИРОВАННЫЕ СПИСКИ
- •8.3.12 ПАРАЛЛЕЛЬНЫЕ ОПЕРАЦИИ ПОИСКА
- •8.3.13 ЦЕПИ В ИНДЕКСЕ
- •9 . Датологический уровень. Сетевая модель
- •9.1 ПРОСТЫЕ И СЛОЖНЫЕ СЕТЕВЫЕ СТРУКТУРЫ
- •9.2 ДАННЫЕ ПЕРЕСЕЧЕНИЯ
- •9.2.2 ЦИКЛЫ
- •9.2.3 ПЕТЛИ
- •9.2.4 ПРИВЕДЕНИЕ СЕТЕВЫХ СТРУКТУР К БОЛЕЕ ПРОСТОМУ ВИДУ
- •9.2.5 Категории схем
- •10 . Иерархическая модель данных
- •10.1 . ДЕРЕВЬЯ
- •10.1.1 СБАЛАНСИРОВАННЫЕ И ДВОИЧНЫЕ ДЕРЕВЬЯ
- •10.1.2 ПРОСТОЕ И СЛОЖНОЕ ОТОБРАЖЕНИЕ
- •10.1.3 ИЕРАРХИЧЕСКИЕ ФАЙЛЫ
- •10.1.4 НАБОРЫ CODASYL
- •10.1.5 ОДНОРОДНЫЕ СТРУКТУРЫ
- •10.1.6 ЗАВИСИМОСТЬ ОТ ПУТИ
- •11 .Реляционная модель данных.
- •11.1 . Элементы теории множеств
- •11.1.1 Множества
- •11.2 . Операции над множествами
- •11.2.1 Декартово произведение множеств
- •11.3 . Отношение
- •11.4 . Примеры отношений
- •11.4.1 Бинарные отношения (отношения степени 2)
- •11.4.2 Отношение эквивалентности
- •11.4.3 Отношения порядка
- •11.4.4 Функциональное отношение
- •11.4.5 Еще пример бинарного отношения
- •11.4.7 Транзитивное замыкание отношений
- •11.5 . Выводы
- •12 . Базовые понятия реляционной модели данных
- •12.1 . Общая характеристика реляционной модели данных
- •12.2 . Типы данных
- •12.2.1 Простые типы данных
- •12.2.2 Структурированные типы данных
- •12.2.3 Ссылочные типы данных
- •12.3 . Типы данных, используемые в реляционной модели
- •12.3.1 Домены
- •12.4 . Отношения, атрибуты, кортежи отношения
- •12.4.1 Определения и примеры
- •12.4.2 Свойства отношений
- •12.5 . Первая нормальная форма
- •12.6 . Выводы
- •13 . Элементы модели "сущность-связь"
- •13.4 . Выводы
5
1Данные как ресурс. Модель, объектные данные. Данные
изнания. Сильная и слабая типизация
Наиболее эффективный способ преобразования знания – проведение исследований, в результате которых человек получает некоторое приращение информации на уровне знаний или данных.
Информация – совокупность сведений, воспринимаемых из окружающей среды, выводящих в окружающую среду или сохраненных внутри какой либо информационной системы.
Данные – информация, представленная виде, позволяющем автоматизировать ее сбор, хранение и дальнейшую обработку человеком или информационным средством. Информация получается из данных путем решения конкретной задачи. Однако, не вся информация может быть получена из данных.
База данных – совокупность взаимосвязанных данных при такой минимальной избыточности, которая позволяет из оптимизировать использование одним или несколькими приложениями в определенной предметной области человеческой деятельности.
Предметная область – отражение в БД совокупности объектов реального мира с из связями, относящихся к некоторой области знаний и имеющих практическую ценность для пользователя.
БД является динамической информационной моделью некоторой предметной области. Наиболее простые подходы определяют две основные модели:
1 сильно типизированные
2 слабо типизированные 1.Сильнотипизированные модели – это модели, данные которых должны быть
явно отнесены к какой-либо категории из ограниченного множества, при помощи специальных методов.
2. Данные могут быть отнесены к какой-либо категории настолько, насколько это целесообразно с точки зрения разработчика. Сильнотипизированные – не гибкие, с их помощью тяжело передать семантические различия между объектами, все объекты имеют одинаковую структуру или являются гомогенными (все объекты должны иметь одинаковое количество полей одинаковой длины).
1.1Достоинства централизованного управления.
Реальные системы обработки информации используют централизованное управление информацией наряду с ее распределение между потребителями.
Достоинства:
1.дешевле управлять
2.сокращается избыточность
3.уменьшается вероятность возникновения противоречивых данных
4.совместное использование данных
5.соблюдение стандартов, что упрощает процесс поддержки всей системы
6.защита от несанкционированного доступа.
7.независимость данных от процедур обработки
6
Недостатки :
1.пользователи теряют право единоличного владения информацией, что приводит к снижению ответственности.
2.необходим аппарат обеспечения не противоречия и достоверности
данных 3.необходим механизм разграничения доступа.
1.2Цели использования БД
1.Независимость данных и программ (изменение информации не должно повлечь изменения программного средства)
2.Отношение между данными (характеризуются связями)
Связь – A GF((xx)) B где F(x) – связь А с В, G(x) – связь В с А.
Функции F(x),G(x) принимают значения U(единственное значение) и N(множественное).
ТИПЫ ОТНОШЕНИЙ:
1.«один к одному»
1:1 |
A |
U |
B |
|
U |
||||
|
|
|
Каждому А соответствует один В и наоборот (факультет – деканат).
2. «один ко многим ».
1:N A UN B
Означает что могут существовать экземпляры объекта А, которым соответствует более одного экземпляра объекта B, и каждому B соответствует только один экземпляр А (факультет - кафедра).
3.«многие к одному».
N:1 A |
N |
B |
|
U |
|||
|
|
Каждому объекту А соответствует один В, и среди В могут быть такие, которым соответствует несколько А (студент - факультет).
4.«многие ко многим».
M:N A |
M |
B |
|
N |
|||
|
|
Может существовать экземпляр объекта А, которому соответствует несколько объектов В, и наоборот (преподаватель – предмет).
3.совместимость компонентов БД (проект БД должен вестись по возможности без привязки к оборудованию)
4.простота изменения логической и физической структуры БД (проектирование БД должно допускать минимальное изменение связанных с ней программы при изменении логической или физической структуры БД).
5.целостность, восстановление защиты и секретность.
