- •Введение. Основные термины и определения.
- •Данные, информация и знания.
- •Структура информационного обеспечения и баз данных.
- •Архитектура субд.
- •Логические модели данных.
- •Иерархическая модель данных.
- •Сетевая модель данных.
- •Реляционная модель данных.
- •Элементы теории бд
- •Способы задания множеств
- •Операции над множеством
- •Отношения
- •Для любого множества матрица вида
- •Свойства отношений
- •Отношение эквивалентности и классификации
- •Отношения порядков
- •Решения, оптимальные по Парето.
- •Структура документа
- •Классификация информации
Элементы теории бд
Теория БД является фундаментальным разделом информационных технологий. По этому поводу существует много фундаментальных трудов.
Способ организации СУБД является ключевым почти во всех аспектах применения компьютерных технологий. В сочетании с телекоммуникационными технологиями организация удаленного доступа и поиска данных создает главные эффекты (выигрыши) от использования компьютерных технологий. Таких эффектов два:
-
ускорение вычислений;
-
ускорение доступа к данным
Современные технологии позволяют хранить данные различной природы (аудио-визуальная информация). Огромное количество информации уже существует в компьютерной форме и стратегической задачей развития компьютерных технологий является повышение уровня компьютерных средств обработки информации, за счет внедрения методов искусственного интеллекта.
В рамках рассмотрения способов представления данных выделен некоторый набор базовых понятий, которые являются общими, несмотря на многообразие программных систем и огромное количество конкретных баз данных.
В качестве элементарной единицы работы с данными выделяется действие, которое называется транзакцией. Транзакция – это единичный цикл полной последовательности шагов, начало которого это формирование запроса, а конечным является предъявление релевантного результата.
Запрос – это любая требуемая операция с описанными в запросе данными. Несмотря на многообразие желаемых действий с информационными единицами такой цикл шагов является устойчивым и повторяемым в многократном применении.
В процессе выполнения транзакции возникают различные проблемы, разрешением которых занимается теория БД:
-
проблема интерпретации запроса;
-
проблема заключается в необходимости полной реализации транзакции в условиях ненадежной работы технических средств и формирования параллельных потоков транзакции;
-
проблема возникает в процессе создания первичных документов, описывающих информационное содержание реальных процессов. Первичные документы, описывающие реальные процессы (ведомости, счета, формы и т.д., в том числе некоторые массивы информации в электронной форме). В процессе создания таких документов руководствуются принципом целесообразности, понятности, доступности для естественной деятельности. Но при попытке представления естественных бумажных документов в машинной форме возникает ситуация, связанная с нарушением целостности представления информации или аномалии в построении модели предметной области.
Первые две проблемы лежат ближе к техническим проблемам организации программного обеспечения СУБД. Третья проблема решается как технологическими средствами, так и корректным с точки зрения приспособленности к машинной обработке представлением первичной информации.
Теория корректного представления информации, гарантирующего обеспечение целостности при осуществлении стандартных операций над данными, разработана в рамках реляционной модели данных американцем Codd. Реляционная модель данных описывается строго математически в рамках теории множеств. В результате сформулированы от трех до шести требований нормализации, которые должны быть выполнены при первичном описании модели предметной области.
Элементы теории множеств
М – множество
А={а1,а2,…,аn}
а А – элемент а принадлежит множеству А
аА, аА – элемент не принадлежит множеству
М1: N – множество натуральных чисел;
М2: ≤100 – множество натуральных чисел ≤100
М3: sinx=1
M4: π/2±kπ, kN
M5: R – множество действительных чисел
М6: УКд-31
М7: «Управление качеством» - множество групп УК.
А и В
АВ: А является подмножеством В, если всякий элемент АВ
Если АВ и ВА, то А=В
С помощью понятия множества формируется первичное описание информационных объектов, причем в примере с М1 по М5 – это информационное определение математических объектов, на основе которых формируются математические выкладки (теоремы, гипотезы). На основании сравнения множеств М3, М4 (М3=М4) формируется, что числа М4 является решением уравнения М3 (sinx=1). В то же время понятие множества может быть распределено на объекты нечисловой природы.
Количество объектов в множестве называется мощностью множества. Множество может быть конечным или бесконечным. Бесконечное множество может быть счетным или образовывать континуум. Множество, мощность которого равна нулю, называется пустым множеством.
|М| = 0 |Ø| = 0
В теории множеств Ø является аналогом 0 и считается, что пустое множество является элементом любого множества. Ø является абстракцией, которая в теории баз данных имеет парадоксальное свойство. В теории БД пустое множество всегда «окрашено», то есть имеет определенную структуру.