
VII. Централизованные и распределенные базы данных План
Необходимость перехода к распределенным БД.
Преимущества распределенных БД.
Решения по созданию распределенных БД.
Пример распределенных БД.
Заключение.
Необходимость перехода к распределенным бд
В централизованных БД пользователи тратят очень много времени на поиск информации (недели и даже месяцы) и доступ к ней. В связи с растущей сложностью и разнообразием данных, представляющих интерес для различных отраслей экономики страны, обеспечение пользователей информацией из одного центра неизбежно становится сложнее.
Уровень технического развития отдельных центров данных потенциально позволяет обеспечить достаточно высокую оперативность обслуживания пользователей. Но при этом требуется много усилий на поддержание актуальности БД.
В нашей стране еще в восьмидесятые годы были созданы оперативные системы централизованного доведения информации до пользователей, например, СИГМА–ОКА (ВНИИГМИ–МЦД), DIALOG (ВИНИТИ) и др. Эти системы, как правило, были уникальными, удовлетворяли нужды отдельных (высокопоставленных) пользователей. Средства этих систем позволяли обеспечить доступ по выделенным каналам связи через центр коммутации сообщений с выдачей результатов поиска на экран видеотерминала и печатающее устройство. К сожалению, из-за высокой стоимости эксплуатации таких систем, недостаточной надежности каналов связи, сбоев ЭВМ, работающих в этих центрах, от них пришлось отказаться.
По мере роста производительности процессоров и неизбежного усложнения программного обеспечения самостоятельная эксплуатация персонального компьютера становится все сложнее и дороже. Некоторые компании (например, Oracle) объявили о намерении развивать новое направление сбыта своей продукции с помощью аренды программных средств через Интернет. Эта технология позволяет использовать сложное программное обеспечение не на серверах локальной сети компании и не на рабочих станциях пользователей, а в центрах данных, т.е. в области распространения и эксплуатации программного обеспечения остается выгодной централизация обслуживания. Такая же тенденция намечается в области эксплуатации крупных серверов БД.
Таким образом, на каждом этапе развития вычислительной техники и методов обработки должен соблюдаться компромисс между уровнем централизации и децентрализации данных и программного обеспечения.
Создание распределенных БД основано не на пустом месте. На первом этапе развития централизованной обработки данных в шестидесятых – начале семидесятых годов были заложены основы сбора данных на технических носителях, создания фондов данных, на втором этапе середина семидесятых – начало восьмидесятых годов – разработка программных средств для научных исследований, на третьем – с середины восьмидесятых годов – создание баз и банков данных. Эти этапы отражают преемственность в развитии системы переработки информации. Решение задач на каждом из них осуществлялось в соответствии с реальным уровнем развития современных методов автоматизированной обработки данных, программного и технического обеспечения и создало предпосылки для перехода к очередному этапу – созданию распределенных БД и удаленной обработки. Централизованный сбор данных позволил сократить трудозатраты на сбор, поиск и систематизацию данных, уменьшить сроки обработки больших массивов данных, увеличить полноту обрабатываемых данных, в т.ч. за счет международного и межведомственного обмена обеспечить одноразовое занесение данных на носитель. Последнее позволило в восьмидесятых годах обеспечить многие учреждения копиями основных массивов данных на магнитных лентах, без чего переход к следующему этапу был бы невозможен, т.к. не был бы накоплен опыт обработки данных в региональных организациях.
Анализ материалов, характеризующих деятельность организаций России, позволяет выделить следующие недостатки и проблемы централизованного создания и обработки БД:
-
не обеспечивается полное и своевременное поступление и занесение данных на технические носители и в то же время есть дублирование занесения данных в различных организациях (не решен вопрос о рациональном распределении потоков данных при их сборе);
-
замкнутость фондов данных в пределах одной отрасли привела к различиям в структуре отраслевых и региональных БД, неодинаковой степени автоматизации сбора и обработки данных, различиям в информационно–технологических процессах при решении одинаковых задач;
-
отсутствие централизованной справочной службы для нескольких родственных отраслей и неодинаковая структура справочно – поискового аппарата;
-
сведения о данных разобщены по нескольким справочным базам данных;
-
отсутствует возможность аналитической обработки данных, низка оперативность и своевременность доведения справочной и исходной информации до пользователя;
-
большинство центров данных не являются составными частями технически согласованной информационной сети, что существенно снижает эффективность их деятельности;
-
из-за недостаточной координации работ центры разрабатывают программные средства сбора и обработки с дублированием, без учета взаимного обмена данными;
-
сложилась ситуация, когда при наличии большого числа данных, они не могут быть использованы с достаточной полнотой и в приемлемые сроки при проведении НИР или принятии решений;
-
при проектировании мало используется типовых проектных решений, различный состав классификаторов, кодификаторов, словарей и методов их ведения, отсутствуют методические материалы по проектированию конкретных приложений, имеется слабая заинтересованность ведомств в необходимости проектирования общей системы, нет методического и проектного руководства со стороны государственных органов;
-
плохо используется пользователями получаемая информация из-за несовершенства форм представления информации, отсутствия системы критериев, регламентирующих использование данных, слабо автоматизируются методы принятия решений.
Повышение эффективности обеспечения пользователей информацией может быть достигнуто за счет интеграции учреждений в систему распределенных БД.