Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии в экономике и управле...doc
Скачиваний:
10
Добавлен:
15.08.2019
Размер:
632.32 Кб
Скачать

4.2. Информационные хранилища

Использование баз данных не дает желаемого результата от автоматизации деятельности предприятия. Причина проста: реализованные функции значительно отличаются от функций ведения бизнеса, так как данные, собранные в базах, не адекватны информации, которая нужна лицам, принимающим решения. Решением данной проблемы стала реализация технологии информационных хранилищ (складов данных).

Информационное хранилище (data warehouse) — это автоматизированная система, которая собирает данные из существующих внутренних баз предприятия и внешних источников, формирует, хранит и эксплуатирует информацию как

единую. К внутренним базам данных предприятия относятся локальные базы предметных приложений и подсистем ЭИС. К внешним - любые данные, доступные по интернету и размещенные на web-серверах предприятий -конкурентов, правительственных и законодательных органов, других учреждений.

Технология информационных хранилищ стала возможной после появления мейнфреймов и оптических устройств хранения данных с высокой емкостью. Среди них можно выделить CD-ROM (оптические диски только для чтения), WORM (диски с однократной записью), МО (магнитооптические диски стираемые и перезаписываемые), оптические библиотеки со сменой дисков вручную, библиотеки - автоматы с автоматической сменой дисков (так называемая технология Jukebox).

Для доступа и размещения данных на таких устройствах разработано много файловых систем. Из них можно выделить системы HSM (Hierarchycal Storage Management) и DM (Data Migration). HSM реализует функции иерархического хранилища, Data Migration - миграции данных. HSM - система создает как бы " продолжение" дискового пространства файлового сервера на вторичных устройствах (библиотеках - автоматах), доступного приложениям (рис. 4.1).

Библиотека - автомат

При конфигурации HSM указывается размер пространства на сервере, f отводимого под буфер для обмена с оптическими библиотеками. Как только это пространство становится занятым и требуется подкачка новых данных из оптической библиотеки - автомата, реализуется алгоритм миграции данных: наименее используемые файлы с сервера переносятся в библиотеку - автомат, освободившееся пространство передается буферу. Из библиотеки в буфер перекачиваются требуемые файлы. Если приложение обратится к "унесенному" файлу, HSM повторяет алгоритм миграции. I

Все перемещения выполняются автоматически и приложения «не подозревают» о наличии вторичных устройств хранения. Смена оптических дисков в библиотеках - автоматах позволяет неограниченно увеличивать базу данных.

Для хранения данных в информационных хранилищах обычно используются выделенные серверы, кластеры серверов (группа накопителей, видеоустройств с общим контроллером), мейнфреймы.

Для доступа к серверам требуются технологии, удовлетворяющие следующим условиям:

• малая задержка. Хранилища данных порождают два типа трафика. Первый содержит запросы пользователей, второй - ответы. Для формирования ответа требуется время. Но так как число пользователей велико, время ответа становится неопределенным. Для обычных данных такая задержка не существенна, а для мультимедийных - существенна;

• высокая пропускная способность. Так как данные для ответа могут находиться в разных базах на значительных расстояниях друг от друга, требуется время на синхронизацию при формировании ответа. Поэтому для обеспечения сбалансированной нагрузки требуется скорость передачи не менее 100 Мега бит/сек;

• надежность. При работе с кластерами серверов интенсивный обмен данными требует, чтобы вероятность потери пакета была очень мала;

• возможность работы на больших расстояниях. Если серверы кластера удалены друг от друга, то требуется технология, обеспечивающая передачу со скоростью не менее 100 Мбит/с, на расстояние 1 км.

Всем этим требованиям удовлетворяет ATM-технология, хотя распространены и по многим показателям дают хорошие результаты технологии Fast Ethernet, Fibre Channel и др.

Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с сетевыми СУБД оптимальна с точки зрения доступа к данным и манипулирования ими. Информационное хранилище обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования, реорганизации бизнеса, принятия обоснованных управленческих решений. При этом происходит "слияние" сведений из внутренних и внешних источников в требуемую предметно ориентированную форму. Объемы данных настолько возросли, что количество переходит в качество.

Именно поэтому технологии информационных хранилищ ориентированы на руководителей, ответственных за принятие решений.

При слиянии данных из разных источников и размещении их в информационном хранилище обеспечивается:

• предметная ориентация; данные организованы в соответствии со способом их представления в предметных приложениях;

• интегрированность; данные выбираются по наименованию, могут принадлежать внутренним и внешним источникам и формы их представления там могут не совпадать;

• упорядоченность во времени; данные согласуются во времени для использования в сравнениях, трендах и прогнозах;

• неизменяемость и целостность; данные не обновляются и не изменяются, а только перезагружаются и считываются из источников на сервер, поддерживая концепцию "одного правдивого источника".

Для описания и управления данными используется метабаза. Мета - приставка, указывающая на то, что объект относится к более высокому уровню абстракции. Метабаза содержит метаданные, которые описывают, как устроены данные, частоту изменений, источник данных (возможны ссылки на распределенные базы, размещенные на серверах с другими платформами), кто и как может пользоваться данными, права доступа и др.

В информационных хранилищах используются экономико-математические методы, генерирующие "информацию об информации"; статистические процедуры суммирования для уменьшения объема данных и ускорения доступа к ним; методы обработки электронных документов, аудио-, видео- информации, графов и географических карт. Для уменьшения размера пространства для хранения на серверах применяются методы сжатия - развертки данных.

Приложениям клиентов метабаза обеспечивает интеллектуальный выбор требуемой им информации по запросам. Запросы объединяются в распределенные транзакции

Управленческому персоналу метабаза обеспечивает предметно-ориентированный подход, показывая, какая информация имеется в наличии, как она получена, как может быть использована. Операции статистического суммирования позволяют руководителю быстро получить обзор ситуации или в деталях рассмотреть нужный предмет. При этом обеспечивается секретность данных, предназначенных различным уровням руководителей и сотрудников.

Руководителям предприятия данные доступны посредством запросов, инструментов создания интерактивных отчетов на экране, многомерного просмотра данных. Для преобразования данных из хранилища в предметно-ориентированную форму используются языки запросов SQL нового поколения. Информационные хранилища стали основой создания систем поддержки принятия решений.

Примерами информационных хранилищ может служить Oracle VLM, разработанная фирмами Oracle и Digital, Red Brick Warehouse 5.0 корпорации Red Brick Systems, Business Information Warehouse и др.

Использование информационных хранилищ дает существенный выигрыш по производительности в системах поддержки принятия решений, в системах обработки большого числа транзакций с большим объемом обновления данных. Сами системы на базе информационных хранилищ называют транзакционными системами OLTP (On-Line Transaction Processing).

Технологию информационных хранилищ можно рассматривать как альтернативу технологии мультипроцессорных систем SMP, получая выигрыш в производительности.

Вопросы для самопроверки

1. Чем отличаются информационные хранилища от баз данных?

2. В чем заключается технология HSM?

3. На кого ориентированы информационные хранилища?

4. Для чего нужна метабаза?

5. Что дает информационное хранилище руководителю?

6. Что дает информационное хранилище приложению?