- •Введение
- •1. Концепция информационных систем
- •1.1. Информация и данные предметных областей
- •1.2. Структура банка данных
- •1.2.1. База данных
- •1.2.2. Система управления базами данных
- •1.2.3. Словарь данных
- •1.2.4. Администратор базы данных и его функции
- •1.3. Контрольные вопросы
- •2. Инфомационное моделирование предметных областей для баз данных
- •2.1. Отображение явлений реального мира данными
- •2.2. Инфологическое моделирование по
- •2.3. Трехуровневое представление информационных объектов
- •2.4. Структурные элементы для моделирования данных
- •2.5. Ключи бд
- •2.6. Интеграция полей бд в отношения
- •2.7. Требования интеграции полей в отношения
- •2.8. Обобщенная структура модели данных в бнд
- •2.9. Er-модель бд
- •2.10. Формирование связей сущностей
- •Способ 1. Определение связи сущностей введением дополнительной сущности
- •Способ 2. Определение связей сущностей добавлением в тип сущности общих атрибутов
- •2.11. Бинарные отношения сущностей
- •2.12. Формы представления структур данных
- •2.13. Организация систем бд
- •2.14. Средства поддержки бд
- •2.15. Виды моделей данных для бд
- •Иерархическая модель данных
- •Сетевая модель данных
- •Реляционная модель данных
- •Контрольные вопросы
- •3. Системы управления базами данных
- •3.1. Функции и состав универсальной субд
- •3.2. Лингвистическое обеспечение субд
- •3.3. Независимость прикладных программ от данных
- •3.4. Операции над данными
- •Селекция данных
- •Обработка данных
- •Запросы к бд
- •3.5. Схема реализации запроса в БнД
- •Распределенная обработка данных
- •Комбинированная обработка данных
- •3.7. Целостность и ограничения целостности данных
- •3.8. Защита данных в бд
- •Контрольные вопросы
- •4.2.2. Вторичный ключ
- •4.3. Функциональные и многозначные зависимости
- •4.3.1. Функциональные зависимости
- •X y (X влечет y).
- •4.3.2. Аксиомы функциональных зависимостей
- •Контрольные вопросы
- •5. Реляционная алгебра
- •5.1. Операции над отношениями
- •5.2. Оператор "объединение" (union)
- •5.3. Оператор "вычитание" (difference)
- •5.4. Оператор "пересечение" (intersection)
- •5.5. Оператор "проектирование" (proj)
- •5.6. Оператор "выбор" (sel)
- •Комбинированный запрос с операторами proj и sel
- •5.7 Оператор "соединение" (join)
- •Запрос с соединением по одному полю
- •Алгоритм реализации
- •Запрос с соединением по нескольким полям
- •Алгоритм реализации
- •Оператор "соединение по условию"
- •5.8. Оператор "умножение" (product)
- •Запрос с оператором умножения
- •Алгоритм реализации
- •5.9. Оператор "деление" (division)
- •5.10. Оптимизация алгоритмов реализации запросов
- •Контрольные вопросы
- •6. Нормализация реляционных бд
- •6.1. Задачи нормализации Бд
- •6.2. Первая нормальная форма
- •6.3. Декомпозиция реляционных таблиц
- •Проблема дублирования, операторы реляционной алгебры для декомпозиции и объединения таблиц
- •Присоединенные записи
- •Теорема Хита
- •Критерий полной декомпозиции с исключением дублирования
- •6.4. Вторая нормальная форма
- •6.5. Третья нормальная форма
- •6.6. Экстранормализационные формы
- •Нормальная форма Бокса-Кодда
- •Четвертая нормальная форма
- •Пятая нормальная форма
- •6.7. Методические аспекты реализации нормализации
- •Контрольные вопросы
1. Концепция информационных систем
1.1. Информация и данные предметных областей
Информация– это понятие, подразумевающее знание определенных сведений, используемых в различных областях человеческой деятельности. На основе информации углубляются познания законов развития материального мира, взаимосвязываются и координируются различные виды работ, контролируются процессы и принимаются решения.
Информациейназываются любые сведения о каких-либо явлениях, событиях, процессах, являющихся объектами восприятия, передачи, преобразования, хранения и использования.
Обычно потребителя информации интересует некоторый конкретный вопрос, область знаний или какая-то определенная совокупность объектов. В соответствии с этим в информационной деятельности введено понятие предметной области.
Предметной областью (ПО) называется определенная часть реального мира, представляющая интерес для конкретного исследования или планируемых действий и соответственно для использования и отображения в информационной системе.
При изучении объекта наблюдатель фиксирует состояние системы в определенной форме без выполнения над ним каких-либо операций. Информация, фиксируемая в определенной форме и пригодная для последующей обработки, хранения и передачи, называется данными. Процесс восприятия состояния системы в виде данных, описывающих состояние системы, называется фиксацией данных. Информация, представляемая в виде зарегистрированных фактов, называется фактографической.
При изучении ПО в соответствии с понятиями "информация" и "данные" рассматривается 2 аспекта:
инфологический;
датологический.
Инфологическийаспект предусматривает рассмотрение вопросов смыслового содержания информации, независимо от способа формирования и организации данных в памяти ЭВМ.
Датологическийаспект рассматривает вопросы организации данных для их представления в памяти информационной системы.
На этом этапе:
формулируются правила смысловой интерпретации данных;
определяются формы представления информации посредством данных в информационной системе;
определяются модели и методы представления и преобразования данных.
Определение смыслового содержания зарегистрированных данных называется семантической информацией (или семантикой). Она необходима для дальнейшего использования в производственных операциях. Основное средство представления семантики данных - это естественный язык.
В общем случае работа с семантикой - это работа со знаниями. Благодаря семантической информации машинные системы способны "понимать" задачу в формулировке пользователя, т.е. реализуются "интеллектуальные" возможности или способности ЭВМ. В результате общение с пользователем становится возможным на естественном языке. При этом в режиме диалога "человек - ЭВМ" возможно использование текстовой, графической, а также речевой форм представления информации и получения результатов ее обработки.
В информационных системах сложноорганизованные данные, содержащие одновременно как фактографическую, так и семантическую информацию, необходимую пользователю для машинного преобразования исходных фактов в соответствии с определенными правилами, т.е. для работы с данными, называются знаниями.
Специализированные информационные системы, оперирующие со знаниями и называемые системами искусственного интеллекта, используются специальные формализованные языки. Эти языки более эффективно реализуют обработку семантической информации.
Для представления знаний в ЭВМ применяются различные модели, среди которых наиболее распространены семантические сети, фреймы, логические модели, системы продукций.
Системы искусственного интеллекта, называемые также интеллектуальными системами, используются для принятия решений в задачах менеджмента, в различных областях экономической деятельности, для автоматического перевода текстов на иностранных языках, доказательства теорем, диагностирования ситуаций, распознавания изображений, автоматизации процессов проектирования и т.д.
Учитывая лавинообразно нарастающие потоки информации в самых различных областях человеческой деятельности, естественен вопрос, как и какими средствами можно представить в ЭВМ столь многообразную и многочисленную информацию и успешно ее использовать. Наиболее совершенной и прогрессивной формой организации информации и знаний в ЭВМ являются банки данных и банки знаний. Главная их задача - это обеспечение пользователей требуемой информацией, т.е. ответы на информационные запросы пользователей к банку данных или банку знаний с целью получения искомой информации.
Банк данных (БнД) - это автоматизированная система, включающая базу данных (БД), лингвистические, программные, технические, организационно-методические средства, обеспечивающие централизованное накопление и коллективное многоцелевое использование информации в различных областях деятельности пользователей. В БнД содержатся совокупности фактов о качественных и количественных характеристиках конкретных объектов предметной области.
Банк знаний (БнЗ) - это автоматизированная система, содержащая различные виды знаний (например, концептуальные, понятийные знания) о предметной области. Эти знания обычно выражаются в терминах данной ПО. Хранящиеся в БнЗ знания используются для вывода новых знаний на основании специальных механизмов, имеющихся в БнЗ.
С БнД и БнЗ в процессе их создания и эксплуатации взаимодействуют пользователи различных категорий, основными из которых являются конечные пользователи. Ими являются специалисты предметных областей, для удовлетворения информационных потребностей которых и создаются БнД и БнЗ. Конечные пользователи различаются: сферой интересов, информационными потребностями, квалификацией и т.п. Под конечным пользователем понимаются как физические лица, так и различные вычислительные процессы, задачи, а иногда и целые системы, взаимодействующие с БнД и БнЗ. Во всех случаях результатом взаимодействия является информация, данные, знания.