Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции / Лекция 11_РБД.doc
Скачиваний:
30
Добавлен:
11.06.2015
Размер:
333.31 Кб
Скачать

237

XI. РАСПРЕДЕЛЕННЫЕ БД

Развитие централизованных и распределенных БД

Распределенные БД - веяние времени

Требования к реализации распределенных вычислений

Проектные решения по созданию распределенных БД

Пример реализации распределенных систем

Развитие централизованных и распределенных бд

Более полувека длится эпоха компьютеризации и за это время произошли кардинальные изменения в аппаратном, программном и информационном обеспечениях. Если на заре становления компьютерных технологий организации имели в своем распоряжении в лучшем случае лишь несколько единиц вычислительной техники, то сегодня инфраструктуру предприятий составляет множество соединенных между собой устройств с выходом в высокоскоростные глобальные сети. Повышение эффективности обеспечения пользователей информацией может быть достигнуто за счет создания системы распределенных БД (РБД). Развитие прикладных архитектур показано на рис.1.

Рисунок 1 - Развитие архитектуры компьютерных систем [1]

Достигнутый уровень технического развития отдельных ведомственных центров данных принципиально позволяет уже сейчас обеспечить достаточно высокую оперативность доступа пользователей. Но на обслуживание в одном центре требуется много усилий для поддержания актуальности БД.

В связи с растущей сложностью и разнообразием данных, представляющих интерес для различных отраслей экономики страны, обеспечение потребителей информацией из одного центра неизбежно стало сложнее. В централизованных БД ведомственных центров данных пользователи тратили много времени на поиск сведений о данных (дни и даже недели) и доступ (минуты, часы, а при больших объемах данных и дни) к данным. Трудоемкость создания информационной системы с огромной БД обусловливается сложностью современных СУБД, их настройкой, а особенно разработкой реальных схем обслуживание пользователей, организации работ по созданию БД, обеспечению их надежности и безопасности.

Создание распределенных БД базируется не на пустом месте. На первом этапе развития централизованной обработки данных в шестидесятых, начале семидесятых годов были заложены основы сбора данных на технических носителях, на втором этапе - середина семидесятых – начало восьмидесятых годов - разработаны АСУ, АИС, Автоматизированные системы для научных исследований (АСНИ), на третьем – в конце восьмидесятых годов - были созданы базы и банки данных. Последние десятилетия характеризуются развитием Интернет– технологий, которые позволяют связать распределенные Интернет-узлы в одну сеть. Эти этапы отражают преемственность в развитии системы переработки информации. Решение задач на каждом из них осуществлялось в соответствии с реальным уровнем развития методов автоматизированной обработки данных, программного и технического обеспечения и создало предпосылки для перехода к очередному этапу – созданию распределенных БД и удаленной обработки данных. Централизованный сбор данных позволил сократить трудозатраты на сбор, поиск и систематизацию данных, уменьшить сроки обработки больших массивов данных, увеличить полноту обрабатываемых данных, в т.ч. за счет международного и межведомственного обмена, обеспечить одноразовое занесение данных на носитель. Последнее позволило обеспечить многие учреждения копиями основных массивов данных на сменных технических носителях, без чего переход к следующему этапу был бы намного трудней, так как не был бы накоплен опыт обработки данных в региональных организациях, не было бы профессиональных коллективов в них.

Многие крупные компании уже много лет разрабатывают средства, позволяющие повысить эффективность доступа к удаленным узлам. Так в России еще в восьмидесятые годы были созданы оперативные системы доведения информации до пользователей, например, система СИГМА-ОКА, (ВНИИГМИ-МЦД), DIALOG (ВИНИТИ) и др. Эти системы, как правило, были уникальными, удовлетворяющими нужды отдельных пользователей. Средства этих систем позволяли обеспечить доступ по выделенным каналам связи через центр коммутации сообщений с выдачей результатов поиска на экран видеотерминала и печатающее устройство. К сожалению, из-за высокой стоимости эксплуатации таких систем, недостаточной надежности каналов связи, сбоев ЭВМ, работающих в этих центрах, они не нашли широкого применения.

По мере роста производительности процессоров и неизбежного усложнения программного обеспечения самостоятельная эксплуатация компьютера становится все сложнее и дороже. А когда стоимость программного обеспечения, необходимого для ведения бизнеса, достигла сотен тысяч долларов, возникли идеи об аренде программного обеспечения. Так, компания Oracle предоставляет свою продукцию на основе аренды СУБД и иных приложений через Интернет. Технология Application Service Provision позволяет использовать сложное программное обеспечение и хранить свои данные не на серверах локальной сети компании и не на рабочих станциях пользователей, а в центрах обработки данных. Они похожи на предприятия, которые четверть века назад назывались вычислительными центрами коллективного пользования. Аренда программных средств снижает уровень контроля пользователя за используемыми ресурсами (программными продуктами, данными, оборудованием).

Уже имеются программные средства, которые позволяют осуществлять доставку приложений на компьютеры и карманные персональные цифровые устройства непосредственно с сервера. Такая разработка предполагает хранение программ - сервисов в одном месте, откуда приложения вызываются с тонких клиентов, установленных на рабочих местах пользователей. Подобная модель является недорогой (с точки зрения расходов на установку и обслуживание). Мониторинг обращений к приложениям и данным централизован, доступ можно получить через web-интерфейс. Когда клиентские устройства находятся в режиме онлайн, система проводит синхронизацию информации, расположенной на сервере. Можно использовать практически любые клиентские устройства, чтобы взаимодействовать друг с другом, получать доступ к данным и приложениями, а также управлять ими в любое время и из любого места, где это только необходимо.

Основными решениями здесь являются – разработка сервисов типа SaaS, интеграция данных.

Для интеграции имеющихся информационных и вычислительных ресурсов, находящихся в разных частях планеты требуются мощные вычислительные установки, которые не могут функционировать без квалифицированного персонала, имеющего практический опыт организации крупномасштабных вычислений. При удаленной работе пользователь использует результаты труда этого персонала. Это обстоятельство оказывается таким же важным, как и наличие доступа к мощным вычислительным ресурсам. Пользователи передают по сети свои требования на ресурсы, а затем используют предоставленные ресурсы.

Распределенные БД могут объединить региональные, национальные и даже международные информационные ресурсы.

У централизованной системы можно выделить следующие недостатки и проблемы:

  • не обеспечивается полное и своевременное поступление и занесение результатов измерений на технические носители и в тоже время есть дублирование занесения данных в различных организациях (не был решен вопрос о рациональном распределении потоков данных при их сборе, копии данных посылались в несколько адресов, где данные могли заноситься на носители самостоятельно);

  • замкнутость фондов данных в пределах одной отрасли, что привело к различиям в структуре отраслевых и региональных БД, неодинаковой степени автоматизации сбора и обработки данных, различиям в информационно-технологических процессах при решении одинаковых задач (различные структуры данных, методы обработки, др.);

  • отсутствие централизованной справочной службы для нескольких родственных отраслей и разнородная структура справочно-поискового аппарата требовали много времени для поиска информации;

  • метаданные (сведения о массивах и БД, организациях- источниках информации, программных средствах обработки и др. объектах метаданных) разобщены по нескольким базам метаданных;

  • отсутствовали программные средства и возможности слежения (мониторинга) за состоянием оборудования и процессов обработки данных;

  • низкая оперативность и своевременность доведения метаданных и исходной информации до пользователей;

  • большинство центров данных не являлись составными частями технически согласованной инфраструктуры, что существенно снижало эффективность их деятельности;

  • из-за недостаточной координации работ центры разрабатывали программные средства сбора и обработки с дублированием, без широкого взаимного обмена данными и программными средствами;

  • при наличии большого числа данных, они не могли быть использованы с достаточной полнотой и в приемлемые сроки при проведении научных исследований или принятии решений;

  • при проектировании централизованных систем мало использовалось типовых проектных решений, создавался различный состав классификаторов, кодификаторов, словарей и методов их ведения, отсутствовали методические материалы по проектированию программных средств, было недостаточное методическое и проектное руководство (практически не назначались главные конструкторы информационных систем, как это принято при создании сложных технических систем);

  • получаемая информация плохо применялась пользователями из-за несовершенства форм ее представления, отсутствия системы критериев, регламентирующих использование данных, слабой автоматизации методов принятия решений;

Соседние файлы в папке Лекции