
- •1.1. Архитектура бд
- •2. Тема 2. Системы управления бд (субд). Выбор систем управления бд. Функции субд.
- •3.1. Жизненный цикл бд. Этапы жц бд.
- •3.1.1. Оценка работы и поддержка б.Д. Производится оценка с точки зрения выполнения требований пользователей. В случае необходимости в систему вносятся изменения.
- •3.1.1.1. Документальные системы
- •3.1.1.2.Обобщенная функциональная структура дипс.
- •3.1.1.3. Коммерческие б.Д.
- •3.1.1.4. Коммерческие базы данных.
- •3.1.1.5. Распределенная обработка данных. Распределенные базы данных
- •3.2. Литература
- •4.1. Уровни.
- •4.2. Этапы проектирования.
- •4.3.Трехуровневая архитектура организации бд
- •4.4. Этапы проектирования: исследование проблемы, этап анализа, проектирование, реализация, внедрение, сопровождение.
- •4.5. Проектирование бд.
- •4.5.1. Этапы проектирования.
- •Тема 5. Средства и методы проектирования бд. Методика диаграмм взаимосвязей между объектами erd-диаграммы. Использование case-технологий при проектировании бд.
- •5.1. Базовые понятия.
- •5.2. Case - приложение eRwin
- •5.2.1. Объекты в eRwin
- •5.2.2. Связь в Erwin
- •6.1. Правила отношений между сущностями. Определение ключей
- •6.2. Нормализация бд. Денормализация бд.
- •Тема 7. Реляционная модель бд. Таблицы. Ограничения целостности данных. Реляционная алгебра. Реляционное исчисление.
- •Тема 8. Организация процессов обработки данных в бд. Обработка транзакций
- •Понятие транзакции.
- •9.1.1. Операторы определения данных ddl
- •9.1.2. Операторы манипулирования данными Data Manipulation Language dml
- •9.1.3. Язык запросов Data Query language (dql)
- •9.1.4. Средства администрирования данных
- •9.1.5. Программный sql
- •9.2. Оператор выборки данных select, использование условий поиска, сортировка результатов запроса. Синтаксис оператора select.
- •C.10. Тема 10. Простые запросы и правила их выполнения. Особенности многотабличных запросов. Объединение таблиц. Использование вложенных запросов
- •10.1. Простые запросы и правила их выполнения
- •10.2. Особенности многотабличных запросов
- •10.3. Объединение таблиц
- •10.4. Использование вложенных запросов
- •Тема 11. Внесение изменений в бд. Добавление информации в бд, удаление данных, изменение существующих данных.
- •C.11.1.Внесение изменений в базу данных
- •Удаление данных
- •11.2. Изменение существующих данных
- •12.1. Специальные аспекты работы с бд. Процедура индексирования.
- •12.2. Триггеры
- •12.2.1. Ключевые слова и параметры
- •12.2.2. Компоненты триггера
- •12.2.3.Типы триггеров.
- •12.2.4.Включение и выключение триггеров.
- •C.12.2.5. Удаление триггера
- •C.12.2.6. Корреляционные имена
- •12.3. Процедуры и функции
- •12.4. Функция
- •12.5.Курсоры.
- •Тема 13. Физическая организация бд на примере Oracle9i. Организация табличных пространств, журналов транзакций. Серверные процессы. Структуры памяти и взаимодействие между процессами.
- •13.1. Архитектура бд.
- •14.1. Системы обработки транзакций oltp и olap - технологий
- •14.2. Хранилища данных. Многомерные хранилища данных
- •14.3. Методы аналитической обработки (olap)
- •14.3.1. Хранилища данных
- •14.3.2. Причины внедрения информационных систем на основе хранилищ данных
- •Литература
- •14.5. Olap в России
- •Тема 15. Основы фракталов. Фрактальная математика. Фрактальные методы в архивации. Управления складами данных
- •15.1. Понятие "фрактал"
- •15.2. Классификация фракталов
- •15.2.1. Геометрические фракталы
- •15.2.2. Алгебраические фракталы
- •C.15.2.3. Стохастические фракталы
- •C.15.3. Системы итерируемых функций
- •15.4. Фрактальное сжатие
- •15.5. История фрактального сжатия
- •15.6. Идея фрактальной архивации
- •15.7. Сравнение с jpeg
- •15.8. Литература
- •Темы рефератов
3.1.1. Оценка работы и поддержка б.Д. Производится оценка с точки зрения выполнения требований пользователей. В случае необходимости в систему вносятся изменения.
Типология БД. Документальные БД. Фактографические БД. Гипертекстовые и мультимедийные БД. XML-серверы. Объектно-ориентированные БД. Распределенные БД, Коммерческие БД.
В 60х гг. появились АИС предназначенные для хранения и обработки информации фактического характера.
По мере интеллектуализации АИС появилась возможность обработки текстовых документов на естественном языке, изображения и другие виды и формы представления данных.
Принципы хранения данных в системе обработки фактической и документальной информации схожи, но алгоритмы их обработки различаются. Таким образом выделяют 2 крупных класса информационных систем:
- Документальные
- Фактографические
Документальные системы служат для работы с документами на естественном языке, это монографии, публикации, сообщениями, различными текстами. Они обеспечивают их смысловой анализ при неполном представлении смысла. Наиболее распространенный тип документальных систем - это информационно поисковые системы (ИПС), предназначенные для накопления, поиска по разным критериям документов на естественном языке.
Другой большой класс - фактографические системы, они оперируют фактическими сведениями, представлены специальным образом в виде организованных совокупностей формализованных записей данных. Фактографические системы используются не только для реализации справочных функций, но и для решения задач обработки данных и предоставление итоговых данных пользователям в табличной форме.
3.1.1.1. Документальные системы
Назначение - чаще всего информация представляется в виде простых текстовых документов. За такими системами укоренилось название информационно-поисковые системы (ИПС).
Документальные информационно-поисковые системы (ДИПС) должны отвечать на запросы пользователей на основе проведения информационного поиска документов. Пользователь формирует информационный запрос к ДИПС на естественном языке (ЕЯ). В теории ДИПС введены 2 фундаментальных понятия:
1. пертинентность - соответствие смыслового содержания документа информационной потребности пользователя
2. релевантность - соответствие содержания документа информационному запросу в том виде, в котором он сформирован.
Автоматизация процесса информационного поиска требовала формализации представлений смыслового содержания информационных запросов и документов в виде поисковых предписаний (ПП) и поискового образа документа (ПОД).
Для записи ПП и ПОД применяют специализированные языки - информационно-поисковые языки (ИПЯ). Поиск осуществляется на основе сопоставления поискового образа документа и поискового предписания ПП и применяется решение о выдачи документа
3.1.1.2.Обобщенная функциональная структура дипс.
В состав типичной ДИПС входят основные подсистемы
1. ввод и регистрация
2. обработка
3. хранение
4
.
поиск
Рисунок 3.1 Основные подсистемы типичной ДИПС.
ПП - поисковые предписания
ПОД - поисковый образ документа
КСС - критерий смыслового соответствия
Текстовые документы, поступающие на вход в системы могут быть представлены как в бумажном, так и в электронном виде. Поэтому подсистема ввода и регистрации решает следующие задачи:
1. создание электронных копий бумажных документов, сканирование с последующим распознаванием или ввод с клавиатуры
2. обеспечение подключения к каналам, доставляющие электронные документы
3. распознавание, а при необходимости, преобразование формата электронных документов
4. присвоение электронным документам уникальных идентификаторов (регистрация)
Все поступающие документы поступают в подсистему хранения для сохранения в базе документов. Подсистема хранения представляет собой совокупность стандартных и специализированных средств архивации, обеспечивающих возможность доступа к данным по предъявляемому идентификатору. Хранение осуществляется в файлах, распределяясь по каталогам жесткого диска. Далее документы поступают в подсистему обработки, задачей которой является программирование для каждого документа поискового образа документа ПОД. ПОД сохраняется в индексе, индекс представляет таблицу, строки которой соответствуют документам, а столбцы - информационным признакам, на основе которых стоится поисковый образ документа ПОД. При поступлении на вход системы запрос пользователя он преобразуется в поисковое предписание и подается на вход подсистемы поиска, задачей которой является описание в индексе поискового образа документа ПОД, удовлетворяющего поисковому предписанию ПП.
Идентификаторы релевантных документов подаются с выхода подсистемы поиска на вход подсистемы хранения, которая осуществляет выдачу пользователю самых релевантных документов.
В организации ДИПС существует проблема иформационного представления содержания текста:
1. недостатки естественного языка:
многообразие средств передачи
2. семантическая неоднозначность:
- синонимия, т.е. тождественность или общность значению слов, выражающих одно и тоже понятие
- многозначность, характеризует неоднозначность понимания отдельных слов, делится на полисемию - совпадение названий различных предметов и антонимию - совпадение названий различных предметов, не имеющих между собой общих свойств
лексичность - пропуск подразумеваемых слов
Поэтому внедрили информационно-поисковые языки (ИПЯ).
ИПЯ - специализированный искусственный язык, предназначенный для описания основного смыслового содержания, поступающих в систему сообщений, с целью обеспечения возможности последующего их поиска.
ИПЯ создается на базе ЕЯ, но более компактен, имеет четкие грамматические правила, отсутствие семантической неоднозначности.
ИПЯ делиться на:
- классификационные
- дескрипторные
Классификационные, в них наравне со славами, выражениями в простые понятия включены словосочетания и фразы, выражающее сложное понятие.
Например
Политика. Внутренняя. Федеральная
Политика. Внутренняя. Региональная.
Политика. Внутренняя.
Следовательно, производится классификация сообщений. Частный случай классификации языка является рубрикатор.
Дескрипторные, в них сложное предложение создаются путем объема лексических единиц во время работы. Готовых предложений или фраз нет из-за небольшого числа лексических единиц такие языки позволяют строить предложения иного смысла, в них отсутствует грамматика
Например:
Владеть Иванов автомобиль
Иванов Владеть автомобиль