Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект ИСЭ.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
624.13 Кб
Скачать
      1. Планирование распределения данных

По мере уменьшения стоимости вычислительных машин и запоминающих устройств всё более распространённым становится распределённая обработка данных. Данные хранятся во многих местах на относительно дешёвых машинах. Необходимость в проектировании здесь ещё большая, чем при наличии централизованных систем БД.

Свойства данных, приводящие к распределению:

  • данные используются на одном периферийном участке и редко или никогда не используются на других;

  • точность, секретность и надёжность данных являются предметом местной заботы;

  • файлы являются простыми и используются одним двумя приложениями. Следовательно, применение БД не даст преимуществ;

  • частота обновлений слишком высока для единой централизованной системы хранения данных;

  • при работе с данными используются специальные приложения, которые могут существенно перегрузить работу центральной системы.

Свойства данных, приводящие к централизации:

  • данные используются централизованными приложениями, такими, как расчёт зарплаты;

  • пользователям во всех областях требуется доступ к одним и тем же данным и при том к их текущей версии. Эти данные часто обновляются;

  • пользователи определённых данных перемещаются с места на место и дешевле централизовать эти данные;

  • данные должны быть хорошо защищены. Процедуры защиты могут быть дорогостоящими;

  • данные слишком массивны для того, чтобы их размещать на недорогих внешних носителях периферийных центров.

Проблемы, связанные с распределением данных:

  • помехи между двумя обновляющими транзакциями;

  • противоречивые считывания при наличии нескольких копий данных.

Количественный анализ распределения данных.

При хорошем распределении данные и программы распределяются в виде кластеров таким образом, что каждый кластер обладает высоким уровнем автономии, и взаимосвязь между ними низкая.

Если бы машины были очень дешёвыми, то на первый взгляд, казалось бы, что лучше помещать данные и программы в том же месте, где протекает деятельность пользователей. К сожалению, многие данные находятся в коллективном пользовании при разных действиях, протекающих в разных местах. Если эти данные копировать, чтобы их можно было хранить в местах расположения пользователей, то изменения в них надо посылать в каждое из этих мест.

Если данные обновляются действиями, происходящими в разных местах и обновления должны быть сиюминутными, легче иметь одну копию данных. Обновлять множество копий в соответствии с текущими изменениями сложно, это повышает число передаваемых сообщений и требует замысловатых процедур восстановления в случае многих вероятных типов отказов.

О различных формах распределения мы можем судить по объёму сообщений между узлами. Рассмотрим, например, систему с терминалами, установленными на N участках. Пользователи на этих участках генерируют транзакции, одни из которых только пользуются данными, а другие изменяют их. Допустим, что происходит

Aп действий/час, которые пользуются данными,

Aи действий/час, которые изменяют данные.

Допустим, что эти действия равномерно распределены между N участками.

Можно показать, что распределение данных приводит к меньшим затратам, чем централизация, если

Так при централизацию следует осуществить, если N>11.