
- •Развитие централизованных и распределенных бд
- •Распределенные бд - веяние времени
- •Среди основных направлений использования распределенных бд можно выделить:
- •Требования к реализации распределенных бд
- •Проектные решения по созданию распределенных бд
- •Примеры реализации распределенных систем
- •Р исунок 2 - Структура есимо
Среди основных направлений использования распределенных бд можно выделить:
-
решение регулярных задач, требующих огромных процессорных ресурсов, памяти и т.д. (усвоение разных видов данных и интерполяция значений в узлы регулярной сетки);
-
организация эффективного использования утилизированных вычислительных ресурсов от временно простаивающих компьютеров;
-
крупные разовые расчеты (получение глобальных климатических обобщений);
-
вычисления с привлечением огромных объемов распределенных данных (прогноз погоды);
-
комплексное обслуживание данными (получение разнородных данных на одной интерактивной карте).
Корпоративная виртуализированная вычислительная среда масштаба предприятия, должна обеспечивать автоматическое распределение нагрузки по всем доступным серверным мощностям и предоставление пользователям ресурсов по требованию. Здесь могут применяться GRID системы [4]. Концепция GRID системы базируется на разработанных средствах кластеризации и реализуется в исключительно однородной среде. Этот подход позволяет динамически выделять/забирать информационные ресурсы для решения задач предприятия, минимизировать перемещение данных между узлами, упростить администрирование систем.
Если имеется регистр веб-сервисов, то пользователь может определить, какой сервис ему нужен, а система сама определит, какие данные нужны этому сервису, где они находятся, сама доставит их этому сервису, а пользователь будет видеть только результат работы сервиса. В будущем большинство пользователей не будут поддерживать БД, а будут пользоваться облачными системами и платить за их использование. Поэтому в создаваемых ОС для GRID основными функциями становятся учетные функции, чтобы каждый пользователь получал счет за предоставленные ему ресурсы.
Есть несколько серьезных проблем, мешающих реализации GRID-сетей (безопасность данных, а также наличие доступной полосы пропускания). Работая в архитектуре «клиент-сервер» процессоры использовались локально, потому что крупные центры данных дорогие, а полоса пропускания слишком узкая. Теперь пытаются перенести в центр данных как можно больше приложений. В распределенной кластерной среде с высокопроизводительными процессорами каждый узел будет обрабатывать свой массив данных, но при этом он должен сверяться с другими узлами, чтобы обеспечить непротиворечивость данных.
Выделяются три типа GRID-проектов:
-
GRID на основе использования добровольно предоставляемых свободных ресурсов;
-
научная GRID;
-
GRID на основе выделения ресурсов по требованию.
Существует четыре типа GRID-инфраструктур:
-
вычислительные среды - появились в начале 90-х годов для использования «спящих» вычислительных ресурсов;
-
информационные среды - появились в 2000 году как средство обмена аудиофайлами;
-
сервисные среды, основанные на Web-сервисах);
-
интеллектуальные среды - сочетают соединение узлов с возможностью управления системными и сетевыми ресурсами, а также ресурсами систем хранения.
Применение концепции GRID позволяет задействовать имеющиеся, но не используемые ресурсы, динамически управляя емкостью, пропускной способностью и вычислительной мощностью множества разрозненных компьютеров. В GRID каждое приложение использует свой набор компьютеров (например, несколько компьютеров – сервера БД; другие компьютеры – сервера приложений и т.д.). С единого пульта можно добавить или удалить компьютеры в/из пула серверов, переместить часть компьютеров серверов приложений в пул серверов и т д. Можно увеличить мощность тех пулов, у которых сейчас нагрузка максимальна.
Важным преимуществом распределенных БД является то, что в качестве ее элементов можно использовать дешевые компьютеры. Систему БД можно строить на базе блэйд - компьютеров, которые выглядят как одна упрощенная плата. Эта плата не содержит избыточных элементов (таких как графические адаптеры, звуковые адаптеры и т д.). Однако из этих плат можно собирать целые шкафы, состоящие из множества таких плат-компьютеров. Некоторые компьютеры позволяют при их перемещении в новый пул автоматически менять программную среду и конфигурацию программного обеспечения, т.е. при перемещении в серверный пул на блэйде запустится еще один узел кластера (или виртуальная машина), который подключится на лету к работающим узлам и разгрузит их.
Одновременно с GRID-системами развивается другое направление, связанное с распределенными БД, - «облачные технологии». Они могут быть реализованы в виде [2]:
-
общедоступных/частных облаков (вычисления в облаке не заменяют полностью нынешнюю корпоративную инфраструктуру и не позволяют передать на аутсорсинг всю деятельность по обработке данных, большинство предприятий продолжают использовать собственные ресурсы, сочетая общедоступные и частные облака);
-
облачных приложений (вычисления в облаке подходят для предварительной обработки данных).
«Облака» это набор технологий. Он представляет собой комбинацию современных технологий (вычисления в grid-сетях, вычисления как коммунальная услуга, “программное обеспечение как сервис”, онлайновое хранение данных), предназначенных для реализации новой парадигмы предоставления ИТ-услуг.
“Облачные” вычисления должны удовлетворять следующим требованиям [3].
-
сервис-ориентированность;
-
масштабируемость и гибкость;
-
совместное использование данных;
-
плата за использование.
Облачные технологии ориентированы на малые и средние предприятия. Многие крупные компании применяют смешанные ИТ-услуги, подразумевающие использование частных и общедоступных облаков. Такой гибридный подход обеспечивает устойчивость бизнеса, защиту информации и коллективное обслуживание. Облачные технологии призваны не только повысить эффективность деятельности предприятий за счет сокращения текущих расходов, стандартизации бизнес-процессов.