10.3.3. Восстановление, основанное на контрольных точках

При возникновении отказа, протоколы, основанные на ЛКТ, восстанавливают состояние системы в наиболее свежее консистентное множество ЛКТ, т.е., линию восстановления. Данный вид восстановления наиболее подходит для приложений, которые не часто взаимодействуют с удаленными ЭВМ. Методы восстановления, основанные на контрольных точках, могут быть классифицированы на три категории: некоординированные, координированные и коммуникационно-вынужденные.

Некоординированный (или независимый) механизм контрольных точек позволяет каждому процессу независимо решать, когда брать контрольные точки. Главным преимуществом данного подхода является низкие временные издержки в течение времени нормального исполнения, вследствие отсутствия координации между процессами. Автономность во взятии ЛКТ также позволяет каждому процессу выбирать такую позицию ЛКТ, которая ведет к уменьшению издержек, сохраняя меньшее количество информации состояния. Главным недостатком является возможность возникновения эффекта домино, как видно из рисунка 10.7, при котором может быть отменено большое количество выполненной полезной работы, независимо от числа взятых ЛКТ. Кроме того, каждый процесс должен поддерживать множественные ЛКТ, и алгоритм сборки мусора должен периодически вызваться для отклонения ЛКТ, которые больше не требуются.

В течение времени безотказного выполнения, зависимости между контрольными точками, образованные в следствии обмена сообщениями, должны быть зарегистрированы таким образом, чтобы консистентная ГКТ могла бы быть определена во время восстановления. Следующая методика прямого отслеживания зависимостей обычно используется в некоординированных протоколах контрольных точек. Пусть c_i_,_x(0 ≤ i ≤ N - 1, x≥0) обозначает x-ую ЛКТ процесса P_i, где i - идентификатор процесса, а x – индекс ЛКТ (мы полагаем, что каждый процесс P_i начинает выполнение с начальной ЛКТ c_i_,0; и I_i_,_x (0 ≤ i ≤ N-1, x ≥ 1) обозначает интервал контрольной точки (или интервал) между c_i_,_x_-1и c_i_,_x.Как показано на рисунке 6, когда процесс P_iна интервале I_i_,_x посылает сообщение m процессу P_j, пара (i,x) переносится вместе с сообщением m. Когда процесс P_j принимает сообщение m в интервале I_j_,_y, он записывает зависимость между I_i_,_x и I_j_,_y, которая позднее сохраняется на устойчивом носителе, во время взятия ЛКТ c_j_,_y.

Рис.10.7. Индекс контрольной точки и интервал контрольной точки.

Если происходит отказ, инициатор отката широковещательно передает dependency_request - сообщение, для сбора всей информации о зависимостях, поддерживаемой отдельно каждым процессом. Когда процесс принимает dependency_request - сообщение, он останавливает выполнение и посылает ответ с сохраненной информацией о зависимостях и информацией о зависимостях, ассоциированной с его текущим временным состоянием (называемой временной контрольной точкой), если таковая доступна. Затем инициатор вычисляет линию восстановления, основываясь на глобальной информации о зависимостях, и широковещательно рассылает rollback-request - сообщение, содержащее линию восстановления. При приеме rollback-request – сообщения, если временная контрольная точка процесса принадлежит линии восстановления, процесс просто возобновляет свое выполнение; иначе, он откатывается к более ранней контрольной точке, как указано в линии восстановления.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 1919

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
15.11.2018286.72 Кб13конденсатор.doc
#
09.02.20152.34 Mб10Конспек лекций по дисциплине.docx
#
01.03.20253.01 Mб0Конспект алгебра.doc
#
01.05.2025785.92 Кб0Конспект лекций 1.doc
#
01.05.2025446.98 Кб0Конспект лекций 2.doc
#
01.05.2025598.02 Кб0Конспект лекций 3.doc
#
01.05.2025889.86 Кб1Конспект лекций 4.doc
#
01.04.20251.76 Mб2Конспект лекций по электронике и МПТ.doc
#
22.03.20167.3 Mб28Конспект лекций.pdf
#
07.05.2019182.27 Кб5Конспект лекций2.doc
#
09.02.20153.47 Mб39Конспект ОиПП 2014_весна_ОФ.doc