Стаття III Використання лінійок Голомбо для оптимальних відновлюючих системах в розподілених обчисленнях толерантних до помилок

Каміла Клоновська, Ларс Люмберг, Хаккан Леннерстад Робота 17-го Інтернаціонального симпозіуму Паралельних та Розподілених обчислень IPDPS 2003, Ніса, Франція, квітень 2003

Резюме

Кластери і розподілені системи дозволяють толерантність до помилок і високу продуктивність завдяки спільному використанню. Коли усі комп'ютери ввімкнені і працюють, ми захотіли б, щоб навантеження було порівну розподілене серед комп'ютерів. Коли один або більше комп'ютерів ламаються, навантаження яке було на цих комп'ютерах має бути перерозподілене на інші комп'ютери в кластері. Перерозподіл визначає схема відновлення. Схема відновлення повинна тримати навантаження, найоптимальніше, як тільки можливо, навіть, коли найнесприятливіші комбінації з комп'ютерів ламаються, тобто ми хочемо оптимізувати найгіршу з можливих варіантів поведінку. У цій статті ми визначаємо схеми відновлення, які оптимальні для ряду важливих випадків. Ми також показуємо, що задача виявлення оптимальних схем відновлення відповідає математичній задачі під назвою Лінійка Голомбо. Вони забезпечують оптимальне відновлення схеми для аж до 373 комп'ютерів в кластрі.

1 Вступ

Єдиний шлях отримання високої придатності і толерантності до помилки - виконувати додаток на кластерній або розподіленій системі. Є головний комп'ютер, який виконує додаток за нормальних умов і вторинний комп'ютер, який приймає задачу, коли головний комп'ютер вимикається. Можливо, також є третій комп'ютер, який приймає задачу, коли головний і вторинний комп'ютери - вимкнені, і так далі. Порядок в якому комп'ютери використані названий порядком відновлення, отриманий списком відновлення. Багато кластерних виконувачів підтримують цей вид виправлення помилок, наприклад: Sun Cluster [14] MC/ServiceGuard (HP) [9], TruCluster (DEC) [15], HACMP (IBM) [1], and MSCS (Microsoft) [10,16].

Перевага користування кластерами, окрім толерантності до помилок, − навантаження, розподілене між комп'ютерами. Коли усі комп'ютери працюють, ми захотіли б, щоб навантаження було розподілене порівну. Проте навантаження на деяких комп'ютерах буде, зростати, коли один або більше комп'ютерів вимикаються, але і за цих умов, ми захотіли б розподілити навантаження якомога порівну на комп'ютерах, що залишилися.

Поширення навантаження, коли комп'ютер вимкнений вирішене порядком відновлення процесів, що проходять на дефолтному комп'ютері. Безліч усіх порядків відновлення є так званою схемою відновлення, тобто поширенням навантаження у разі коли один або більше дефектів визначається схемою відновлення. Задача виявлення оптимальних (або навіть кращих) схем відновлення раніше не була вивчена іншими дослідниками.

У попередній статті [8] ми визначили схеми відновлення, які оптимальні для деяких випадків. У цій статті ми подали нові схеми відновлення, для яких оптимальним є значно більше число пошкоджених комп'ютерів. Деякі з схем засновані на так званій лінійці Голомбо, яка була використана в радіоастрономії.

<<< < Предыдущая 13 14 15 16 17 18 19 20 21 22 23 2425 / 5425 26 27 28 29 30 31 32 33 34 35 36 37 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.2016202.75 Кб17Переддипломна практика.doc
#
26.08.201964.86 Кб3переддипломна практика.docx
#
01.05.2025346.62 Кб1переддипломна.docx
#
12.02.2016250.88 Кб8Передипл практика,5,2012 (2).doc
#
01.04.20254.64 Mб1ПЕРЕДМОВА 2 книги 27 12 2011.doc
#
01.03.20255.67 Mб1переклад - відредаговано.doc
#
15.08.201983.46 Кб1Переклад.doc
#
12.02.20163.33 Mб6Переклад.docx
#
12.02.201612.13 Mб5ПЕРЕКЛАД.docx
#
25.08.201956.32 Кб1Перел_к основних нормативних документ_в.doc
#
01.05.202528.66 Кб1перелік відповідей.docx