
- •90 Символы, отношения и графы
- •Введение План:
- •Введение. Предмет и задачи курса, понятие предметной области
- •Документальные информационно - поисковые системы
- •Сетевые технологии передачи данных
- •Информационно - поисковые системы в Интернет
- •Фактографические информационные системы
- •Экспертные системы, базовые понятия
- •Понятие системы Основные составляющие системы.
- •Компоненты и свойства системы
- •Состояние системы3
- •Виды состояний4
- •Статическое и динамическое состояние
- •Установившееся и переходное динамическое состояние
- •Исходное и возмущенное состояние
- •Устойчивое и неустойчивое состояние
- •Свободное и вынужденное состояние
- •Обратимые и необратимые состояния.
- •Тема. Данные Общие понятия и определения
- •Концепция трех схем хранения данных
- •Технология анализа предметной области
- •Анализ концептуальных требований и информационных потребностей
- •Выявление информационных объектов и связей между ними
- •Построение концептуальной модели предметной области
- •Логическое проектирование
- •Реляционная модель данных
- •Понятия математической логики
- •Сетевая модель данных
- •Организация веерного отношения в памяти эвм
- •Алгоритм получения двухуровневой структуры сети
- •Отображение информационной схемы на сетевую модель данных
- •Иерархическая модель данных
- •Сравнение моделей данных
- •Средства для описания данных Символы
- •Отношения
- •Некоторые свойства графов
- •Деревья
- •Раскрашенные графы как инструмент представления данных
- •Методы ускорения доступа к данным
- •Адресная функция
- •Построение хеш-функции.
- •Ключи состоящие из нескольких слов, ключи переменной длины
- •Разрешение коллизий методом "цепочек".
- •Индексы
- •Тема 7. Проектирование реляционных бд на основе принципов нормализации
- •Системный анализ предметной области
- •Дата логическое проектирование
- •Формы нормальных отношений
- •Тема 8 Нормализация отношений
- •. Вторая нормальная форма
- •Третья нормальная форма
- •Нормальная форма Бойса-Кодда
- •Четвертая нормальная форма
- •Пятая нормальная форма
- •Лекция информационные системы Понятие информационной системы
- •Компоненты информационной системы
- •Архитектура информационной системы
- •История развития информационных систем
- •Процессы, обеспечивающие работу информационной системы
- •Принципы построения информационной системы
- •Структура информационной системы
- •2.3.1. Информационное обеспечение
- •2.3.2. Техническое обеспечение
- •2.3.3. Математическое и программное обеспечение
- •2.3.4. Организационное обеспечение
- •2.3.5. Правовое обеспечение
- •Типы, оценка и области применения информационных систем Классификация информационных систем по функциональному признаку
- •Система обработки данных
- •Автоматизированная система управления
- •Информационно-поисковые системы
- •Классификация информационных систем по профессиональному признаку
- •Типы информационных систем
- •Информационная система оперативного уровня
- •Информационные системы специалистов
- •Информационные системы для менеджеров среднего звена
- •Стратегические информационные системы
- •Классификация по сфере применения
- •Использование информационных систем в практической деятельности Информационные системы в бизнесе
- •Бухгалтерские информационные системы (буис)
- •Особенности функционирования буис на крупных предприятиях
- •Особенности функционирования буис на предприятиях малого и среднего бизнеса
- •Банковские информационные системы
- •Справочно-правовые информационные системы
- •Рассмотрим наиболее известные системы, существующие в нашей стране. Система "Консультант Плюс"
- •Система "Гарант"
- •Информационная система «Договор»
- •Системы распознавания и перевода текста Системы оптического распознавания текста
- •Системы электронного перевода
- •Электронные словари
- •Корпоративные информационные системы: технологии и решения Общий взгляд на предприятия с точки зрения информационной системы
- •Основные этапы создания корпоративной ис
- •Информационное обследование
- •Архитектура ис
- •Выбор субд
- •Выбор системы автоматизации документооборота
- •Выбор программных средств для управления документами
- •Выбор специализированных прикладных программных средств.
- •Общие выводы
Фактографические информационные системы
Фактографические информационные системы оперируют фактическими сведениями, представляемыми в виде специальным образом организованных совокупностей формализованных записей данных. В фактографических ИС регистрируются факты – конкретные значения данных (атрибутов) об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Информация, с которой работает фактографическая ИС, имеет четкую структуру, позволяющую машине отличать одно данное от другого, – например, фамилию от должности человека, дату рождения от роста и т. п.
Фактографический поиск представляет собой поиск фактов, непосредственно отвечающих на запрос. Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы, например: “Сколько велосипедов марки А-18 продал магазин “Спорт” в июне 2004 г.?”, “Кто из работников фирмы с датой рождения не ранее 1 января 1970 г. имеет водительские права?”, “Какие культурно-исторические памятники Санкт-Петербурга включены в список ЮНЕСКО?” и т. д.
Центральным функциональным звеном фактографических информационных систем являются системы управления базами данных.
Современные СУБД оперируют огромными массивами информации, объемы которых достигают десятков терабайт. Выполняя запрос пользователя они должны обеспечит время отклика порядка нескольких секунд. Для этого во всех СУБД организован метод ускоренного доступа к данным. В настоящее время в СУБД используется два метода организации прямого доступа: индексирование и хэширование.
Метод индексирования основан на использовании индексов. Индекс это специальная структура создаваемая автоматически или по запросу пользователя. Индекс похож на предметный указатель книг. Работа с ним выглядит, так же как и с предметным указателем. Разница лишь в том, что СУБД делает все автоматически. В индексах все значения хранятся упорядоченно, каждому значению соответствует указатель на строку таблицы. Индекс занимает значительно меньший объем, чем таблица, а также упорядоченное хранение информации значительно ускоряет ее поиск.
Основная идея хэширования – организация ассоциативной памяти для хранения строк таблицы. Место строки вычисляется хэш-функцией, аргументы которой фактографические описания, а результат – целое число в диапазоне номеров строк таблицы. Идеальная хэш-функция должна давать разные значения номеров строк для разных ключевых атрибутов. Однако построить такую функцию не всегда удается.
Доступ к данным при хэшировании производится так. В начале работы с БД таблица состоит из пустых строк. Когда строка с данными заносится в таблицу, для нее вычисляется значение хэш-функции и результат трактуется как номер строки таблицы, в которую она должна быть записана. Если эта строка уже занята, то по некоторому алгоритму производится проверка следующих строк таблицы до тех пор, пока не будет обнаружено свободное место (при этом, как правило, считается, что таблица имеет кольцевую структуру). В это место и помещается записываемая строка. Для поиска данных используется аналогичный алгоритм. Сначала вычисляется значение хэш-функции для требуемого значения фактографического описания и проверяется строка таблицы, номер которой вычислен хэш-функцией. Если описание, по которому происходит доступ, соответствует значению ключа строки, то поиск заканчивается. В противном случае проверяются следующие строки таблицы до обнаружения строки с нужным значением или пустой строки. Пустая строка свидетельствует об отсутствии заданного описания — процедура занесения данных обязательно использовала бы ее, если бы оно существовало.
Если таблица заполнена не более чем на 60%, то для размещения в ней новой строки необходимо проверить в среднем не более двух ячеек. Иногда для устранения коллизий, возникающих, если хэш-функция выдает номер занятой строки, используют не линейный просмотр, а более сложные методы.
База данных бесполезна, если отсутствуют средства доступа к информации в ней. Для получения информации из БД пользователи направляют СУБД запросы. СУБД обрабатывает их и отправляет результаты обработки пользователям. Запросы формулируются на специальном «языке запросов». Фактическим стандартом такого языка для современных реляционных СУБД стал SQL (Structured Query Language — структурный язык запросов). В текущий стандарт языка SQL входят операторы такие как: «ВЫБРАТЬ ДАННЫЕ ИЗ БД», «ДОБАВИТЬ ДАННЫЕ В БД», «УДАЛИТЬ ДАННЫЕ ИЗ БД» и т.п.
Таблицы невозможно хранить и обрабатывать, если в базе отсутствуют «данные о данных» (метаданные), например, описатели таблиц, столбцов и т.д. Метаданные также представлены в табличной форме и хранятся в словаре данных.