- •Раздел 1. Основы информационного обеспечения процессов и систем.
- •1.1. Понятие и содержание информационного обеспечения. (вопросы 1, 2)
- •1.1.1. Понятие информационного обеспечения. (вопросы 1, 2)
- •1.1.2. Понятие информации. (вопрос 1)
- •1.1.3. Понятие данных и их структуры. (вопрос 1)
- •1.1.4. Документированная информация. (вопрос 1)
- •1.1.5. Информационная система. (вопрос 1)
- •1.1.6. Службы информационного обеспечения. (вопрос 1)
- •1.1.7. Функциональная структура информационного обеспечения. (вопрос 2)
- •1.2. Организационная структура и классификация аис. (вопрос 3)
- •1.2.1. Организационная структура аис.
- •1.2.2. Классификация аис.
- •1.3. Система представления аис. Уровни представления. (вопрос 4)
- •1.3.1. Информационно – логическая модель. Концептуальная модель.
- •1.3.2. Логическая структура данных.
- •1.3.3. Внутренняя схема базы данных.
- •Раздел 2. Системы управления базами данных фактографических информационных систем.
- •2.1. Функции, классификация и структура субд. (вопросы 5, 6)
- •2.1.1. Функции, реализуемые субд. (вопрос 5)
- •2.1.2. Структура и взаимодействие компонент субд. (вопрос 6)
- •2.2. Реляционная модель организации данных. (вопросы 7,8)
- •2.2.1. Структурная составляющая. (вопрос 7)
- •2.2.2. Целостная составляющая. (вопрос 8)
- •2.2.3. Манипуляционная составляющая реляционной модели (операции над данными). (вопрос 8)
- •2.3. Внутренняя схема баз данных. (вопросы 9-14)
- •2.3.1. Состав внутренней схемы базы данных. (вопрос 9)
- •2.3.2. Физические структуры организации файлов данных. (вопрос 10, 11)
- •2.3.3. Индексирование данных.
- •2.3.3.1. Линейные структуры индексов. (вопрос 12)
- •2.3.3.2. Нелинейные структуры индексов. (вопрос 13)
- •2.3.4. Расстановка (хеширование) записей. (вопрос 14)
- •2.3.4.1. Расстановка записей по числовому значению ключей.
- •2.3.4.2. Расстановка записей по текстовым ключевым полям.
- •Раздел 3. Каноническое проектирование автоматизированных информационных систем.
- •3.1. Требования стандартов. Стадии и этапы создания аис.
- •3.2. Состав стадий и этапов канонического проектирования аис. (вопрос 15)
- •3.3. Состав и содержание работ на предпроектной стадии создания аис. (вопрос 16)
- •3.3.1. Сбор материалов обследования. (вопросы 17-23)
- •3.3.2. Формализация материалов обследования. Системные спецификации. (вопросы 24, 25)
- •3.3.3. Матричная модель экономической информационной системы объекта. (вопрос 26)
- •3.3.4. Анализ материалов обследования. (вопрос 27)
- •3.3.5. Составление тэо и формирование тз. (вопрос 28)
- •3.4. Состав и содержание работ на стадии «Техно - рабочего проектирования». (вопросы 29-35)
- •3.4.1. Техническое проектирование. (вопросы 29-33)
- •3.4.2. Рабочее проектирование. (вопросы 34, 35)
- •3.5. Состав и содержание работ на стадиях внедрения, эксплуатации и сопровождения проекта. (вопросы 36-38)
- •Раздел 4. Концептуальное проектирование аис.
- •4.1. Разработка концептуальной модели службы документационного обеспечения управления. (вопросы 39-42)
- •4.1.1. Изучение области использования ис. (вопрос 39)
- •4.1.2. Формирование и анализ круга функций и задач аис. (вопрос 40)
- •4.1.3. Определение основных объектов-сущностей. (вопрос 41)
- •4.1.4. Формализованное описание концептуальной схемы банка данных. (вопрос 42)
- •Раздел 5. Проектирование логической структуры базы данных.
- •5.1. Этапы проектирования схем реляционных баз данных. (вопрос 43)
- •5.2. Проектирование и создание схем таблиц. (вопросы 44-49)
- •5.2.2. Правила генерации таблиц из er-диаграмм со связями степени 1:1. (вопрос 45)
- •5.2.4. Правила генерации таблиц из er-диаграмм со связями 1: n. (вопрос 47)
- •5.2.5. Предварительные таблицы для бинарных связей степени «многие – ко - многим». (вопрос 48)
- •5.2.6. Правила генерации таблиц со связями m:n. (вопрос 49)
- •5.3. Определение и установление индексов. (вопрос 50)
- •5.4. Создание списков (словарей) для полей с перечислительным характером значений данных. (вопрос 51)
- •5.5. Установление ограничений целостности по полям таблиц и связям. (вопрос 53)
- •5.6. Нормализация таблиц. (вопрос 54)
- •5.6.1. Первая нормальная форма. (вопрос 55)
- •5.6.2. Вторая нормальная форма. (вопрос 56)
- •5.6.3. Третья нормальная форма. (вопрос 57)
- •5.7. Способы создания таблиц, ключей, связей. (вопрос 58)
2.3.3. Индексирование данных.
Стандартным приемом повышения эффективности доступа к записям в базах данных является создание индексных массивов по отдельным, обычно ключевым полям.
Использование линейного упорядочения записей в таблице (например, по алфавиту для текстовых ключевых полей или по возрастанию значений числовых ключевых полей) приводит к тому, что накладные расходы по ранжированию всей таблицы после добавления либо удаления строк – превышает выигрыш по времени доступа.
Структура индексов (индексных массивов) строится так, чтобы на основе некоторого критерия можно было бы быстро находить по значению индексируемого поля указатель на нужную запись – строку таблицы и получить к ней доступ. При этом не обязательно упорядочивать совокупность записей базовой таблицы, а при изменении записей необходимо изменить лишь только индексный массив.
Для индексных массивов, как и для информационных массивов самих данных (таблиц) применимы линейные и нелинейные структуры.
2.3.3.1. Линейные структуры индексов. (вопрос 12)
В качестве линейных структур индексов в большинстве случаев выступают инвертированные списки.
Инвертированный список строится по схеме таблицы с двумя колонками – «Значение индексируемого поля» и «Номера строк». На практике номера строк не самой базовой таблицы, а номера строк файла БД, где расположена соответствующая строка (см. рис. 2.15).
Инвертированные списки чаще всего применяются для индексации полей, значения которых в разных строках-записях могут повторяться. Например, поле «Год рождения» таблицы «Сотрудники» (в реляционных базах данных такие поля не могут быть ключевыми). Строки инвертированного списка упорядочиваются по значению индексируемого поля.
Для доступа к нужной строке исходной таблицы сначала в упорядоченном инвертированном списке отыскивается строка с требуемым значением поля, затем считывается номер соответствующей строки или строк в исходной таблице и далее по нему уже производится доступ к исходной строке базовой таблицы.
При добавлении новой строки в базовую таблицу ее значение по индексируемому полю ищется в ранее составленном индексе. Если соответствующая строка инвертированного списка отыскивается (т.е. подобное значение индексируемого поля среди строк таблицы уже встречалось и было поставлено на учет), то в ячейку второго столбца соответствующей строки индекса дописывается номер страницы, куда была помещена соответствующая строка базовой таблицы.
Рис. 2.15. Пример инвертированного списка.
Если такого значения в индексе нет, то создается новая строка индекса и осуществляется переупорядочение нового состояния индексного массива.
При удалении строки из базовой таблицы также производится поиск соответствующей строки в индексном массиве и осуществляется вычеркивание в индексе соответствующего номера отсылаемой строки базовой таблицы. Если при этом других строк в базовой таблице с таким же значением индексируемого поля не осталось, (соответствующая ячейка индекса стала пустой), то удаляется и вся строка индекса с последующим переупорядочением всего индексного массива. При этом за счет того, что индекс в виде инвертированного списка содержит лишь один столбец значений, затраты на переупорядочение при добавлении или удалении записей существенно меньше по сравнению с тем, если бы переупорядочение происходило непосредственно в самой базовой таблице. Кроме того, строки базовой таблицы можно упорядочивать только лишь по какому-либо одному полю, а индексные массивы можно создавать сразу по нескольким полям.
Индексы в виде инвертированных списков являются особенно эффективными в том случае, когда значения индексируемого поля часто повторяются, образуя равномерные по мощности группы. В этом случае количество ситуаций, при которых требуется добавление или удаление строк индекса, невелико, и затраты на переупорядочение индекса при изменениях данных в базовой таблице незначительны.
В результате выигрыш по затратам на доступ существенно превышает накладные расходы по переупорядочению индекса в процессе ведения базы данных.