Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИНФОРМАЦ. ТЕХНОЛОГИИ УПРАВЛЕНИЯ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
199.68 Кб
Скачать

8. Банк данных, его состав и особенности. Хранилище данных

Банк данных (БнД) – это автоматизированная система специальным образом организованных данных – баз данных, программных, технических, языковых, организационно-методических средств и персонала, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.

БнД призван обеспечивать интегрированность и целостность баз данных, независимость и минимальную избыточность хранимых данных, их защиту от несанкционированного доступа или случайного уничтожения.

В общем случае БнД состоит из БД (или не скольких БД), СУБД, словаря данных, администратора, компьютерной системы и обслуживающего персонала.

Организация данных в БД требует предварительного моделирования, т.е. построения логической модели данных.

Модель данных – это некоторая абстракция, которая, будучи приложима к конкретным данным, позволяет разработчикам и пользователям трактовать их уже как информацию – сведения, содержащие не только данные, но взаимосвязь между ними. Главное назначение модели данных – систематизация разнообразной информации и отражение ее свойств по содержанию, структуре, объему, связям, динамике с учетом удовлетворения информационных потребностей всех категорий пользователей.

К классическим моделям представления данных относят иерархическую, сетевую и реляционную.

Иерархическая модель данных представляет информационные отображения объектов реального мира – сущности и их связи в виде ориентированного графа, или дерева.

В иерархической модели отношения между данными бывают типа «родитель-потомки», т.е. у каждого объекта только один родитель (у корневого объекта нет родителя), но в принципе может быть несколько потомков.

Такие отношения принято изображать в виде дерева, где ребро между объектами отображает наличие некоторого отношения, причем название отношения пишется на ребре. Например, между объектами «клиент» и «заказ» может быть отношение, которое называется «делает», а между «заказ» и «товары» – отношение «состоит из».

Сетевая модель, как более общая, предоставляет большие возможности по сравнению с иерархической, однако она сложнее в реализации и использовании.

В настоящее время наибольшее распространение при разработке БД получила реляционная модель данных. Понятие реляционной модели данных (от английского relationотношение) связано с разработками Эдгара Кодда. Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата реляционной алгебры и реляционного исчисления для обработки данных.

Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Реляционная таблица представляет собой двумерный массив и обладает следующими свойствами;

  • каждый элемент таблицы – один элемент данных;

  • все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный или другой) и длину;

  • каждый столбец имеет уникальное имя;

  • одинаковые строки в таблице отсутствуют;

  • порядок следования строк и столбцов может быть произвольным.

Система управления базами данных (СУБД) – комплекс программных и языковых средств, предназначенный для создания, ведения и совместного использования БД многими пользователями. СУБД различают по используемой модели данных. Они обеспечивают многоцелевой характер использования БД, защиту и восстановление данных. Наличие развитых диалоговых средств и языка запросов делает СУБД удобным средством для конечного пользователя.

К наиболее важным признакам классификации современных СУБД могут быть отнесены:

  • среда функционирования – класс компьютеров и ОС для работы СУБД;

  • тип поддерживаемой в СУБД модели данных;

  • возможности встроенного языка СУБД, его переносимость в другие приложения (SQL, Visual Basic и др.);

  • наличие развитых диалоговых средств конструирования таблиц, форм, запросов, отчетов, макросов и средств работы с БД;

  • уровень использования – локальная СУБД (для настольных систем), архитектура клиент-сервер, многопроцессорная СУБД (с параллельной обработкой данных);

  • использование объектной технологии OLE (Object Linking and Embedding – связывание и внедрение объектов);

  • возможности интеграции данных из разных СУБД;

  • степень поддержки языка SQL и возможности работы с сервером баз данных (SQL-сервером);

Услугами банка данных пользуется большое число пользователей. Поэтому в банке данных предусматривается словарь данных – подсистема банка данных, предназначенная для хранения информации о структурах данных, взаимосвязях файлов БД друг с другом, типах данных и форматах их представления, кодах защиты и разграничения доступа и т.п.

Администраторы БД – это группа пользователей, отвечающих за выработку требований к БД, ее проектирование, создание, эффективное использование и сопровождение.

Компьютерная система, на базе которой функционирует банк данных, представляет собой совокупность взаимосвязанных и согласованно действующих компьютеров и других устройств, обеспечивающих автоматизацию процессов приема, обработки и выдачи информации пользователям.

Обслуживающий персонал банка данных (программисты, инженеры по техническому обслуживанию компьютеров, административный аппарат) призван поддерживать технические и программные средства в работоспособном состоянии, осуществлять обеспечение совместимости и взаимодействия всех составляющих, контроль за работой банка данных, за качеством информации.

Банк данных и БД в случае расположения на одном компьютере называются локальными, при расположении на нескольких компьютерах, соединенных компьютерной сетью, – распределенными. Локальные БнД предназначены для организации более простого и дешевого способа информационного обслуживания пользователей, работающих с небольшими объемами данных при решении несложных задач.

Хранилище данных

На сегодня наиболее востребованной технологией, используемой при реализации аналитической ИС, являются хранилища данных (ХД).

Хранилище данных (data warehouse) – очень большая предметно-ориентированная информационная корпоративная база данных, предназначенная для подготовки отчётов, анализа бизнес-процессов с целью поддержки принятия решений в организации. ХД строится на базе клиент-серверной архитектуры, реляционной СУБД и утилит поддержки принятия решений.

Данные из промышленной OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчетов и OLAP-анализ не использовал ресурсы промышленной системы и не нарушал ее стабильность. Данные загружаются в хранилище с определенной периодичностью, поэтому актуальность данных несколько отстает от OLTP-системы.

OLTP (Online Transaction Processing) – онлайновая обработка транзакций. Способ организации БД, при котором система работает с транзакциями небольшими по размерам, но идущими большим потоком, и при этом клиенту требуется от системы максимально быстрое время ответа. OLTP-системы предназначены для ввода, структурированного хранения и обработки информации (операций, документов) в режиме реального времени.

OLAP (англ. online analytical processing, аналитическая обработка в реальном времени) – технология обработки информации, включающая составление и динамическую публикацию отчётов и документов. Используется аналитиками для быстрой обработки сложных запросов к базе данных. Служит для подготовки бизнес-отчетов по продажам, маркетингу, в целях управления, т. н. data mining – добыча данных (способ анализа информации в базе данных с целью отыскания аномалий и трендов без выяснения смыслового значения записей).

Транзакция (англ. transaction) – группа последовательных операций, которая представляет собой логическую единицу работы с данными. Транзакция может быть выполнена целиком либо успешно, соблюдая целостность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще и тогда она не должна произвести никакого эффекта. Транзакции обрабатываются транзакционными системами, в процессе работы которых создаётся история транзакций.