
- •А.В. Брешенков
- •Проектирование баз данных на основе информации табличного вида
- •1. Анализ проблемы проектирования реляционных баз данных на основе использования информации табличного вида 8
- •5. Назначение ключевых полей 142
- •6. Выявление и формирование связей между заполненными таблицами 157
- •7. Объединение таблиц 190
- •8. Разработка и исследование модели методики проектирования реляционных баз данных на основе использования информации табличного вида 220
- •Предисловие
- •Глава 5 посвящена методу назначения ключевых полей в заполненных нереляционных таблицах.
- •1. Анализ проблемы проектирования реляционных баз данных на основе использования информации табличного вида
- •1.1. Понятие информации табличного вида
- •1.2. Мотивы преобразования информации табличного вида в файлы реляционных баз данных
- •1.3. Основные требования к средствам преобразования информации табличного вида в реляционные таблицы
- •1.4. Задачи объединения и разбиения реляционных таблиц
- •1.5. Задачи нормализации реляционных таблиц
- •1.6. Преобразование реляционных нормализованных таблиц в файлы бд
- •1.7. Вопросы преобразования электронных таблиц
- •Упражнения и вопросы для самоконтроля
- •2. Постановка задачи проектирования реляционных баз данных на основе использования информации табличного вида
- •2.1. Укрупненная модель реляционной базы данных
- •2.2. Укрупненная модель информации табличного вида
- •2.3. Задачи преобразования заполненных нереляционных таблиц в реляционные таблицы Преобразование нереляционных таблиц в реляционные таблицы
- •Нормализация заполненных таблиц
- •Назначение ключевых полей для заполненных таблиц
- •Выявление и формирование связей между заполненными реляционными таблицами
- •Упражнения и вопросы для самоконтроля
- •3. Преобразование нереляционных таблиц в реляционные таблицы
- •3.1. Приведение значений атрибутов заполненных таблиц к одному типу
- •3.2. Исключение дублирования записей
- •Упражнения и вопросы для самоконтроля
- •4. Нормализация заполненных реляционных таблиц.
- •4.1. Проблемы нормализации
- •4.2. Модели информации табличного вида и реляционных таблиц.
- •4.2.1. Модель информации табличного вида
- •4.2.2. Модель реляционной таблицы
- •4.3. Преобразование заполненных таблиц к первой нормальной форме
- •4.3.1. Избавление от сложных атрибутов
- •4.3.2. Исключение подзаголовков расположенных внутри таблицы
- •4.3.3. Нормализация заполненных таблиц с подзаголовками в первом столбце.
- •4.4. Преобразование заполненных таблиц ко второй нормальной форме
- •4.5. Преобразование заполненных таблиц к третьей нормальной форме
- •Избавление от функциональной зависимости.
- •4.6. Преобразование заполненных таблиц к четвертой нормальной форме.
- •Упражнения и вопросы для самоконтроля
- •5. Назначение ключевых полей
- •5.1. Задача назначения ключевых полей в заполненных реляционных таблицах
- •5.2. Алгоритмы назначения ключевых полей в заполненных реляционных таблицах
- •Упражнения и вопросы для самоконтроля
- •6. Выявление и формирование связей между заполненными таблицами
- •6.1. Выявление и формирование связей один - к одному
- •6.2. Выявление и формирование связей один - ко многим
- •6.3. Выявление и формирование связей многие - ко многим.
- •Формирование 3-й таблицы для реализации многозначных связей.
- •Упражнения и вопросы для самоконтроля
- •7. Объединение таблиц
- •7.1. Проблемы объединения таблиц
- •Исходные таблицы по своей природе удовлетворяют требованиям совместимости, а по форме – нет.
- •Исходные таблицы удовлетворяют требованиям совместимости, результирующую таблицу необходимо обновлять.
- •Исходные таблицы частично удовлетворяют требованиям совместимости.
- •7.2. Объединение и обновление совместимых таблиц
- •7.3. Объединение таблиц, частично удовлетворяющих требованиям совместимости
- •Упражнения и вопросы для самоконтроля
- •8. Разработка и исследование модели методики проектирования реляционных баз данных на основе использования информации табличного вида
- •8.1. Постановка задачи разработки модели методики
- •8.2. Операторная модель преобразования информации табличного вида к реляционным базам данных
- •8.3. Исследование методики преобразования информации табличного вида в реляционные базы данных
- •8.4. Исследование динамических свойств функционирования системы.
- •8.5. Исследование временных свойств системы.
- •Упражнения и вопросы для самоконтроля
- •Список литературы
1.2. Мотивы преобразования информации табличного вида в файлы реляционных баз данных
Под файлами реляционных БД понимают файлы данных и вспомогательные файлы, которые созданы разработчиками БД и средствами СУБД для обеспечения функционирования БД. Файлы данных представляют собой информацию табличного вида, хранимую в форме реляционных таблиц данных, а также файлы ключевых и индексных полей. Вспомогательные или системные файлы генерируются, как правило, автоматически средствами СУБД и могут быть просмотрены, а иногда скорректированы администратором БД. Пользователь БД доступа к этим файлам обычно не имеет и часто не подозревает об их существовании. Строгий формальный подход к хранению и обработке информации табличного вида в реляционных БД, продуманный механизм сопровождения данных обуславливают сведение к минимуму неоднозначную интерпретацию информации, непротиворечивость данных и надежность их хранения.
В каких случаях оправданно преобразование информации табличного вида в файлы реляционных баз данных?
В настоящее время существует множество документов с информацией табличного вида, представленной только на бумаге. Например, многостраничные сводки экспериментов, справочники, словари и т.п. Это обусловлено тем, что документы, не утерявшие актуальность, подготовлены на печатной машинке, тем, что утеряны электронные формы документов, тем, что до настоящего времени не все имеют доступ к вычислительной технике, а также другими причинами. Не вызывает сомнения, что электронная форма документов предпочтительней - обеспечивается возможность оперативного и удобного редактирования, модификации и обработки данных. Информацию табличного вида, представленную на бумаге, оправданно преобразовать в формат электронных таблиц, а во многих случаях и в формат баз данных. Это связано с тем, что системы этих классов обладают специальными средствами работы с данными табличного вида.
Немало информации табличного вида, как показано на рис.1.1 и рис 1.3, существует в текстовом формате или в формате Microsoft Word. Но потребности пользователей этой информации таковы, что им удобнее работать с ней, используя средства СУБД.
Значительная часть информации табличного вида сегодня хранится в формате электронных таблиц. Несмотря на неоспоримые достоинства программных систем данного класса, во многих случаях они не позволяют в полном объеме решать многие проблемы. В частности, БД по сравнению с электронными таблицами обладают следующими преимуществами:
БД позволяют не только вводить данные в таблицы, но и контролировать правильность вводимых данных (их соответствие назначенному типу, их соответствие принятому формату, их соответствие условию на значение);
БД могут хранить огромное количество записей и при этом СУБД обеспечивают удобные способы извлечения из этого количества нужной информации;
если все необходимые для работы данные хранить в электронных таблицах, то по мере накопления информации легко запутаться в большем объеме файлов. БД позволяют хранить все данные в одном файле, и доступ к этим данным осуществляется постранично, т.е. не превышаются ограничения на ресурсы памяти компьютера;
в БД возможно создание связей между таблицами, что позволяет совместно использовать данные из нескольких таблиц, при этом для пользователя они будут представляться одной таблицей;
предоставляя связи между отдельными таблицами, БД позволяют избежать дублирования данных, сэкономить память компьютера, а также увеличить скорость и точность обработки информации;
у БД значительно больше возможностей при работе нескольких пользователей с одними и теми же данными. При этом все пользователи гарантированно будут работать с актуальными данными;
БД имеют развитую систему защиты от несанкционированного доступа, которая позволяет каждому пользователю или категории пользователей видеть или изменять только те объекты, на которые ему были выданы права администратором системы.
Проблемы преобразования информации табличного вида в файлы БД стоят во многих организациях. В частности, нередко на предприятиях информация о проданном оборудовании поступает из различных регионов в виде файлов Microsoft Excel. В главном офисе компании установлена БД, в которой накапливаются и обрабатываются данные из регионов. Преобразование таблиц Microsoft Excel в формат БД осуществляется вручную. Работы такого рода трудоемки, а результаты преобразования не гарантируют отсутствия ошибок. Многие предприятия подготовили каталоги изделий в виде текстовых файлов. Сейчас возникла потребность разработки БД, основу которой составляют эти каталоги. Не вызывает сомнения то, что существует и ряд других ситуаций, когда организации остро нуждаются в эффективных средствах преобразования информации табличного вида в файлы БД.
Таким образом, на основании сказанного выше, можно сделать вывод о том, что проблема преобразования информации табличного вида в файлы реляционных баз данных актуальна. И работы в данном направлении представляют практический интерес. Это справедливо как для документов табличного вида, представленных на бумаге, так и для документов, хранящихся в электронной форме, будь то текстовые файлы, файлы текстовых процессоров или файлы электронных таблиц.