Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии в экономике и управле...doc
Скачиваний:
0
Добавлен:
15.08.2019
Размер:
632.32 Кб
Скачать

4.2. Информационные хранилища

Использование баз данных не дает желаемого результата от автоматизации деятельности предприятия. Причина проста: реализованные функции значительно отличаются от функций ведения бизнеса, так как данные, собранные в базах, не адекватны информации, которая нужна лицам, принимающим решения. Решением данной проблемы стала реализация технологии информационных хранилищ (складов данных).

Информационное хранилище (data warehouse) — это автоматизированная система, которая собирает данные из существующих внутренних баз предприятия и внешних источников, формирует, хранит и эксплуатирует информацию как

единую. К внутренним базам данных предприятия относятся локальные базы предметных приложений и подсистем ЭИС. К внешним - любые данные, доступные по интернету и размещенные на web-серверах предприятий -конкурентов, правительственных и законодательных органов, других учреждений.

Технология информационных хранилищ стала возможной после появления мейнфреймов и оптических устройств хранения данных с высокой емкостью. Среди них можно выделить CD-ROM (оптические диски только для чтения), WORM (диски с однократной записью), МО (магнитооптические диски стираемые и перезаписываемые), оптические библиотеки со сменой дисков вручную, библиотеки - автоматы с автоматической сменой дисков (так называемая технология Jukebox).

Для доступа и размещения данных на таких устройствах разработано много файловых систем. Из них можно выделить системы HSM (Hierarchycal Storage Management) и DM (Data Migration). HSM реализует функции иерархического хранилища, Data Migration - миграции данных. HSM - система создает как бы " продолжение" дискового пространства файлового сервера на вторичных устройствах (библиотеках - автоматах), доступного приложениям (рис. 4.1).

Библиотека - автомат

При конфигурации HSM указывается размер пространства на сервере, f отводимого под буфер для обмена с оптическими библиотеками. Как только это пространство становится занятым и требуется подкачка новых данных из оптической библиотеки - автомата, реализуется алгоритм миграции данных: наименее используемые файлы с сервера переносятся в библиотеку - автомат, освободившееся пространство передается буферу. Из библиотеки в буфер перекачиваются требуемые файлы. Если приложение обратится к "унесенному" файлу, HSM повторяет алгоритм миграции. I

Все перемещения выполняются автоматически и приложения «не подозревают» о наличии вторичных устройств хранения. Смена оптических дисков в библиотеках - автоматах позволяет неограниченно увеличивать базу данных.

Для хранения данных в информационных хранилищах обычно используются выделенные серверы, кластеры серверов (группа накопителей, видеоустройств с общим контроллером), мейнфреймы.

Для доступа к серверам требуются технологии, удовлетворяющие следующим условиям:

• малая задержка. Хранилища данных порождают два типа трафика. Первый содержит запросы пользователей, второй - ответы. Для формирования ответа требуется время. Но так как число пользователей велико, время ответа становится неопределенным. Для обычных данных такая задержка не существенна, а для мультимедийных - существенна;

• высокая пропускная способность. Так как данные для ответа могут находиться в разных базах на значительных расстояниях друг от друга, требуется время на синхронизацию при формировании ответа. Поэтому для обеспечения сбалансированной нагрузки требуется скорость передачи не менее 100 Мега бит/сек;

• надежность. При работе с кластерами серверов интенсивный обмен данными требует, чтобы вероятность потери пакета была очень мала;

• возможность работы на больших расстояниях. Если серверы кластера удалены друг от друга, то требуется технология, обеспечивающая передачу со скоростью не менее 100 Мбит/с, на расстояние 1 км.

Всем этим требованиям удовлетворяет ATM-технология, хотя распространены и по многим показателям дают хорошие результаты технологии Fast Ethernet, Fibre Channel и др.

Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с сетевыми СУБД оптимальна с точки зрения доступа к данным и манипулирования ими. Информационное хранилище обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования, реорганизации бизнеса, принятия обоснованных управленческих решений. При этом происходит "слияние" сведений из внутренних и внешних источников в требуемую предметно ориентированную форму. Объемы данных настолько возросли, что количество переходит в качество.

Именно поэтому технологии информационных хранилищ ориентированы на руководителей, ответственных за принятие решений.

При слиянии данных из разных источников и размещении их в информационном хранилище обеспечивается:

• предметная ориентация; данные организованы в соответствии со способом их представления в предметных приложениях;

• интегрированность; данные выбираются по наименованию, могут принадлежать внутренним и внешним источникам и формы их представления там могут не совпадать;

• упорядоченность во времени; данные согласуются во времени для использования в сравнениях, трендах и прогнозах;

• неизменяемость и целостность; данные не обновляются и не изменяются, а только перезагружаются и считываются из источников на сервер, поддерживая концепцию "одного правдивого источника".

Для описания и управления данными используется метабаза. Мета - приставка, указывающая на то, что объект относится к более высокому уровню абстракции. Метабаза содержит метаданные, которые описывают, как устроены данные, частоту изменений, источник данных (возможны ссылки на распределенные базы, размещенные на серверах с другими платформами), кто и как может пользоваться данными, права доступа и др.

В информационных хранилищах используются экономико-математические методы, генерирующие "информацию об информации"; статистические процедуры суммирования для уменьшения объема данных и ускорения доступа к ним; методы обработки электронных документов, аудио-, видео- информации, графов и географических карт. Для уменьшения размера пространства для хранения на серверах применяются методы сжатия - развертки данных.

Приложениям клиентов метабаза обеспечивает интеллектуальный выбор требуемой им информации по запросам. Запросы объединяются в распределенные транзакции

Управленческому персоналу метабаза обеспечивает предметно-ориентированный подход, показывая, какая информация имеется в наличии, как она получена, как может быть использована. Операции статистического суммирования позволяют руководителю быстро получить обзор ситуации или в деталях рассмотреть нужный предмет. При этом обеспечивается секретность данных, предназначенных различным уровням руководителей и сотрудников.

Руководителям предприятия данные доступны посредством запросов, инструментов создания интерактивных отчетов на экране, многомерного просмотра данных. Для преобразования данных из хранилища в предметно-ориентированную форму используются языки запросов SQL нового поколения. Информационные хранилища стали основой создания систем поддержки принятия решений.

Примерами информационных хранилищ может служить Oracle VLM, разработанная фирмами Oracle и Digital, Red Brick Warehouse 5.0 корпорации Red Brick Systems, Business Information Warehouse и др.

Использование информационных хранилищ дает существенный выигрыш по производительности в системах поддержки принятия решений, в системах обработки большого числа транзакций с большим объемом обновления данных. Сами системы на базе информационных хранилищ называют транзакционными системами OLTP (On-Line Transaction Processing).

Технологию информационных хранилищ можно рассматривать как альтернативу технологии мультипроцессорных систем SMP, получая выигрыш в производительности.

Вопросы для самопроверки

1. Чем отличаются информационные хранилища от баз данных?

2. В чем заключается технология HSM?

3. На кого ориентированы информационные хранилища?

4. Для чего нужна метабаза?

5. Что дает информационное хранилище руководителю?

6. Что дает информационное хранилище приложению?

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.