
- •Управление данными
- •1. Базы и банки данных
- •Информация, данные, знания ?
- •1.3. Банки данных
- •1.4. Преимущества Банка данных
- •1.6. Классификация языковых средств
- •1.8. Пользователи банков данных
- •1.9. Администраторы банка данных
- •2. Модели и структуры баз данных
- •2.1. Инфологическая модель
- •2.2. Понятие модели данных
- •2.3. Иерархическая структура и модель данных
- •2.4. Сетевая структура бд
- •2.5. Реляционные базы данных
- •Должен использоваться единый язык для взаимодействия с субд.
- •2.6. Диаграмма «сущность-связь» Чена
- •2.7. Объектно-ориентированные базы даных
- •2.8. Нормализация бд
- •2.9. Об эволюции и многообразии моделей данных
- •3... Технология «хранилище данных»
- •3. 1 Концепция хранилища данных
- •3.2. Витрины данных
- •3.3. Категории данных в хд
- •3.4. Метаданные
- •3.5. Потоки данных
- •3.7. Преобразование данных.
- •3.8. Загрузка данных и очистка данных
- •3.9. Выявление проблем в данных
- •4. Технологии управления данными
- •4.1. Oltp-системы
- •4.2. Многомерная модель данных
- •4.3. Olap-системы
- •12 Основных требований е. Кодда
- •5. Технологии интеллектуального анализа данных
- •5.1.Методология анализа данных
- •5.2. Технология Data Mining
- •5.3. Технология kdd
- •Лабораторные работы
1.3. Банки данных
В «Общеотраслевых руководящих материалах по созданию банков данных» (М.: ГКНТ, 1982) дано следующее определение: «Банк данных — это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно - методических средств, предназначенных для обеспечения централизованного накопления и коллектив Анализ подходов к определению понятия БнД показал, что термин «банк данных» не является общепризнанным. В некоторой англоязычной литературе в последнее время используется термин «система баз данных» (database system), который по своему содержанию близок введенному понятию банка данных (система баз данных включает базу данных, систему управления базами данных, соответствующее оборудование и персонал. Слово «банк» является в этом смысле лучше, так как «банк» привычно обозначает не только то, что хранится в нем, но и всю инфраструктуру, Однако очевидно, что нельзя отождествлять понятия «база данных» и «банк данных». Банк данных является сложной системой, включающей в себя все обеспечивающие подсистемы, необходимые для функционирования любой системы автоматизированной обработки данных.
БнД - может рассматриваться в узком и широком смысле этого понятия.
В узком БнД=БД + СУБД. В широком БнД =АС (автоматизированная система). БнД в узком смысле включает в состав две основные компоненты: БД и СУБД, которая используется для реализации централизованного управления данными, хранимыми в базе, доступа к ним, поддержание их в состоянии, соответствующем состоянию ПО. В широком смысле БнД - это АС.
Рис. 1. Общая структура БнД
Важной особенностью БнД является наличие специальных языковых и программных средств, облегчающих для пользователей выполнение всех операций, связанных с организацией хранения данных, их корректировки и доступа к ним. Такая совокупность языковых и программных средств называется системой управления базой данных (СУБД).
Таким образом, БнД - совокупность базы данных с соответствующей системой управления базами данных (СУБД).
СУБД специальный комплекс программ, осуществляющий функции создания базы данных, поддержание ее в рабочем состоянии, выдача из нее информации, необходимой для обрабатывающих программ и т.д.
Одним из важных понятий БнД является словарь данных (СД), который представляет собой специальную систему в составе БнД, предназначенную для хранения единообразной информации обо всех ресурсах данных конкретного банка. В словаре содержатся сведения об объектах, их свойствах и отношениях для данной ПО, сведения о данных, хранимых в базе (наименования данных, их структуре, связи с другими данными), об их возможных значениях и форматах представления, об источниках их возникновения, о кодах защиты, разграничениях доступа к данным со стороны пользователей.
Информационная база БнД – это данные, отражающие состояние определенной предметной области и используемые информационной системой. Состоит из двух компонент: коллекции записей собственно данных и описания этих данных – метаданных. Данные могут использоваться (т. е. представляться) по-разному. С одной стороны, разные прикладные задачи требуют разных наборов данных, в совокупности обеспечивающих функциональную полноту информации, а с другой – они должны быть различны для различных категорий субъектов (разработчиков или пользователей). Назначение – представление данных на трех уровнях. В литературе по БД упоминается три уровня представления данных: концептуальный ( пользователь, разработчик ИС), внешний или логический ( прикладной программист), внутренний или физический ( СУБД). Лингвистические средства обеспечивают интерфейс пользователей разных категорий с банком данных и базируются на языковых средствах СУБД. Включают в себя ЯОД, описание, модель данных и их отношения и ЯМД – средства запросов к БД и поддержания БД. Программные средства осуществляют обработку данных и управление этой обработкой в вычислительной среде, а также взаимодействие с операционной системой и прикладными программами. Основные компоненты: ядро (обеспечивает управление данными во внешней и оперативной памяти, а также протоколирование изменений), процессор языка баз данных (обработка – трансляция или компиляция – и оптимизация запросов на выборку и изменение данных), подсистема (библиотека) поддержки программных вызовов (обслуживает прикладные программы управления данными, взаимодействующие с СУБД через средства пользовательского интерфейса), сервисные программы (системные и внешние утилиты) (обеспечивают настройку СУБД, восстановление после сбоев и ряд дополнительных возможностей обслуживания). Технические средства служат для обеспечения эффективной и бесперебойной работы баз данных. Должны быть отказоустойчивыми, иметь надежные устройства ввода-вывода и объемные быстродействующие накопители. Организационно-административные подсистемы и нормативно-методическое обеспечение – не являются технической компонентой системы, однако трудно рассчитывать на устойчивое и долговременное функционирование банка данных, если будут отсутствовать необходимые методические и инструктивные материалы, регламентирующие работу пользователей, различных по своему статусу и уровню полноценности.