- •1. Общая характеристика информационных технологий
- •1.1 .Понятие информационной технологии
- •1.1.1. Понятие платформы
- •1.1.2. Понятие и структура технологического процесса обработки
- •1.1.3. Технологии общения с компьютером
- •1.1.4. Режимы обработки информации
- •1.2. Эволюция информационных технологий
- •1.3. Свойства информационных технологий
- •1.4. Классификация информационных технологий
- •2. Информационные технологии общего назначения
- •2.1. Электронный офис
- •2.1.1. Технология ole
- •2.2. Технологии обработки графических образов
- •2.3. Гипертекстовая технология
- •2.4. Технология мультимедиа
- •2.5. Сетевые технологии
- •2.5.1. Технологии и услуги Интернет
- •2.5.2. Технологии поиска в сети Интернет
- •2.6. Технологии электронной почты
- •2.7. Технологии обеспечения безопасности обработки информации
- •3. Интегрированные технологии
- •3.1. Видеоконференция
- •3.2. Технологии геоинформационных систем
- •5.3. Интеллектуальные информационные технологии
- •4. Интегрированные информационные системы
- •4.1. Технологии распределенной обработки данных
- •4.2. Информационные хранилища
- •4.3. Технологии электронного документооборота,
- •4.3.1. Электронный документооборот
- •4.3.2. Управление знаниями
- •4.3.3. Управление новациями
- •4.4. Системы групповой работы
- •4.5. Инструменты построения корпоративной информационной системы
- •4.5.1. Инструменты технологии и нтранет
- •4.5.2. Инструменты создания корпоративных информационных систем
- •4.5.3. Транснациональные информационные системы
- •5. Информационные технологии в управлении
- •5.1. Экспертные системы
- •5.2. Аналитические системы
- •5.3. Системы поддержки принятия решений
4.2. Информационные хранилища
Использование баз данных не дает желаемого результата от автоматизации деятельности предприятия. Причина проста: реализованные функции значительно отличаются от функций ведения бизнеса, так как данные, собранные в базах, не адекватны информации, которая нужна лицам, принимающим решения. Решением данной проблемы стала реализация технологии информационных хранилищ (складов данных).
Информационное хранилище (data warehouse) — это автоматизированная система, которая собирает данные из существующих внутренних баз предприятия и внешних источников, формирует, хранит и эксплуатирует информацию как
единую. К внутренним базам данных предприятия относятся локальные базы предметных приложений и подсистем ЭИС. К внешним - любые данные, доступные по интернету и размещенные на web-серверах предприятий -конкурентов, правительственных и законодательных органов, других учреждений.
Технология информационных хранилищ стала возможной после появления мейнфреймов и оптических устройств хранения данных с высокой емкостью. Среди них можно выделить CD-ROM (оптические диски только для чтения), WORM (диски с однократной записью), МО (магнитооптические диски стираемые и перезаписываемые), оптические библиотеки со сменой дисков вручную, библиотеки - автоматы с автоматической сменой дисков (так называемая технология Jukebox).
Для доступа и размещения данных на таких устройствах разработано много файловых систем. Из них можно выделить системы HSM (Hierarchycal Storage Management) и DM (Data Migration). HSM реализует функции иерархического хранилища, Data Migration - миграции данных. HSM - система создает как бы " продолжение" дискового пространства файлового сервера на вторичных устройствах (библиотеках - автоматах), доступного приложениям (рис. 4.1).
Библиотека - автомат
При конфигурации HSM указывается размер пространства на сервере, f отводимого под буфер для обмена с оптическими библиотеками. Как только это пространство становится занятым и требуется подкачка новых данных из оптической библиотеки - автомата, реализуется алгоритм миграции данных: наименее используемые файлы с сервера переносятся в библиотеку - автомат, освободившееся пространство передается буферу. Из библиотеки в буфер перекачиваются требуемые файлы. Если приложение обратится к "унесенному" файлу, HSM повторяет алгоритм миграции. I
Все перемещения выполняются автоматически и приложения «не подозревают» о наличии вторичных устройств хранения. Смена оптических дисков в библиотеках - автоматах позволяет неограниченно увеличивать базу данных.
Для хранения данных в информационных хранилищах обычно используются выделенные серверы, кластеры серверов (группа накопителей, видеоустройств с общим контроллером), мейнфреймы.
Для доступа к серверам требуются технологии, удовлетворяющие следующим условиям:
• малая задержка. Хранилища данных порождают два типа трафика. Первый содержит запросы пользователей, второй - ответы. Для формирования ответа требуется время. Но так как число пользователей велико, время ответа становится неопределенным. Для обычных данных такая задержка не существенна, а для мультимедийных - существенна;
• высокая пропускная способность. Так как данные для ответа могут находиться в разных базах на значительных расстояниях друг от друга, требуется время на синхронизацию при формировании ответа. Поэтому для обеспечения сбалансированной нагрузки требуется скорость передачи не менее 100 Мега бит/сек;
• надежность. При работе с кластерами серверов интенсивный обмен данными требует, чтобы вероятность потери пакета была очень мала;
• возможность работы на больших расстояниях. Если серверы кластера удалены друг от друга, то требуется технология, обеспечивающая передачу со скоростью не менее 100 Мбит/с, на расстояние 1 км.
Всем этим требованиям удовлетворяет ATM-технология, хотя распространены и по многим показателям дают хорошие результаты технологии Fast Ethernet, Fibre Channel и др.
Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с сетевыми СУБД оптимальна с точки зрения доступа к данным и манипулирования ими. Информационное хранилище обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования, реорганизации бизнеса, принятия обоснованных управленческих решений. При этом происходит "слияние" сведений из внутренних и внешних источников в требуемую предметно ориентированную форму. Объемы данных настолько возросли, что количество переходит в качество.
Именно поэтому технологии информационных хранилищ ориентированы на руководителей, ответственных за принятие решений.
При слиянии данных из разных источников и размещении их в информационном хранилище обеспечивается:
• предметная ориентация; данные организованы в соответствии со способом их представления в предметных приложениях;
• интегрированность; данные выбираются по наименованию, могут принадлежать внутренним и внешним источникам и формы их представления там могут не совпадать;
• упорядоченность во времени; данные согласуются во времени для использования в сравнениях, трендах и прогнозах;
• неизменяемость и целостность; данные не обновляются и не изменяются, а только перезагружаются и считываются из источников на сервер, поддерживая концепцию "одного правдивого источника".
Для описания и управления данными используется метабаза. Мета - приставка, указывающая на то, что объект относится к более высокому уровню абстракции. Метабаза содержит метаданные, которые описывают, как устроены данные, частоту изменений, источник данных (возможны ссылки на распределенные базы, размещенные на серверах с другими платформами), кто и как может пользоваться данными, права доступа и др.
В информационных хранилищах используются экономико-математические методы, генерирующие "информацию об информации"; статистические процедуры суммирования для уменьшения объема данных и ускорения доступа к ним; методы обработки электронных документов, аудио-, видео- информации, графов и географических карт. Для уменьшения размера пространства для хранения на серверах применяются методы сжатия - развертки данных.
Приложениям клиентов метабаза обеспечивает интеллектуальный выбор требуемой им информации по запросам. Запросы объединяются в распределенные транзакции
Управленческому персоналу метабаза обеспечивает предметно-ориентированный подход, показывая, какая информация имеется в наличии, как она получена, как может быть использована. Операции статистического суммирования позволяют руководителю быстро получить обзор ситуации или в деталях рассмотреть нужный предмет. При этом обеспечивается секретность данных, предназначенных различным уровням руководителей и сотрудников.
Руководителям предприятия данные доступны посредством запросов, инструментов создания интерактивных отчетов на экране, многомерного просмотра данных. Для преобразования данных из хранилища в предметно-ориентированную форму используются языки запросов SQL нового поколения. Информационные хранилища стали основой создания систем поддержки принятия решений.
Примерами информационных хранилищ может служить Oracle VLM, разработанная фирмами Oracle и Digital, Red Brick Warehouse 5.0 корпорации Red Brick Systems, Business Information Warehouse и др.
Использование информационных хранилищ дает существенный выигрыш по производительности в системах поддержки принятия решений, в системах обработки большого числа транзакций с большим объемом обновления данных. Сами системы на базе информационных хранилищ называют транзакционными системами OLTP (On-Line Transaction Processing).
Технологию информационных хранилищ можно рассматривать как альтернативу технологии мультипроцессорных систем SMP, получая выигрыш в производительности.
Вопросы для самопроверки
1. Чем отличаются информационные хранилища от баз данных?
2. В чем заключается технология HSM?
3. На кого ориентированы информационные хранилища?
4. Для чего нужна метабаза?
5. Что дает информационное хранилище руководителю?
6. Что дает информационное хранилище приложению?