
- •Теоретичні Аспекти на Межі Продуктивності і Толерантність Дефекту в Паралельному Обчисленні
- •1 Вступ
- •1.1 Дослідницькі Питання
- •1.2 Дослідницька Методологія
- •1.3 Дослідницьке Сприяння
- •2 Багатопроцесорне Планування (Частина I)
- •2.1 Класифікація планування проблем
- •2.2 Межі і Складність на Багатопроцесорному Плануванні
- •3 Баланс Навантаження і толерантність дефекту (Частина 2)
- •3.1 Модель Дефекту
- •3.2 Надійність проти Доступності
- •4 Підсумок Статей
- •4.1 Частина 1
- •4,2 Частина 2
- •5 Робота в майбутньому.
- •1 Вступ
- •2 Попередні результати
- •3 Визначення і основні результати
- •3.1 Позначення
- •3.2 Визначення
- •3.3 Основні результати і план статті
- •4 Перетворення програми р в нову програму що містить вузьку і широку частину.
- •4.1 Програма р’ як м-ідентична копія програми р
- •4.2 Продовження процесів
- •4.3 Від чотирьох копій в три нові програми
- •4.4 Перетворення програмP в програму з «товстою» і «тонкою» частинами
- •5 Товста частина
- •5.1 Перетворення p в q
- •5.2 Перетворення q в q'
- •5.3 Властивості розміщення товстої частини
- •5.4 Обчислення товстої частини
- •6 Тонка частина
- •7 Об'єднання товстих і тонких частин
- •7.1 Знахідка оптимального розміщення, що користується класами розміщення
- •7.2 Гілково-граничний алгоритм
- •8 Твердження
- •9 Обговорення
- •10 Висновки
- •Стаття 2 Стаття 2 «Максимальна Вигода Збільшення Числа пріоритетних Переривань у Багатопроцесорному Плануванні»
- •Введення до роботи
- •2. Формування проблем, позначення і основні результати.
- •2.1. Формулювання завдання
- •2.2. Позначення і терміни
- •(Білі прямокутники показують неперервні роботи)
- •2.3. Основний результат
- •3. Докази
- •3.1. Методи доведення
- •3.2. Перевищення програми p'
- •4. Висновки
- •5. Обговорення
- •6. Список літератури
- •Стаття III Використання лінійок Голомбо для оптимальних відновлюючих системах в розподілених обчисленнях толерантних до помилок
- •1 Вступ
- •2 Формулювання задачі
- •3 Загальна нижчня межа b
- •4. Ощадні Схеми Відновлення
- •5 Лінійка Голомбо
- •6. Висновок
- •7. Список літератури
- •8. Додаток: Оптимальні Послідовності
- •1 Вступ
- •1. Формулювання задачі
- •Попередня робота
- •Ощадливі Схеми Відновлення і Схеми Відновлення Голомбо
- •Модульна Схема Відновлення
- •Схеми Голомбо проти схеми модуля
- •8. Висновки
- •8. Список літератури
- •1 Вступ
- •2. Проблемне формулювання
- •3. Попереднє дослідження
- •4. Схеми відновлення
- •4.1. Нижчий mv межі
- •4.2. Послідовність s
- •4.3. Приклад послідовності
- •4.4. Регулярна схема відновлення
- •4.5. Приклад схеми відновлення, заснованої на послідовності
- •5. Схеми відновлення чотирикутника з непаралельними сторонами проти схеми відновлення Голомбо
- •6. Обговорення і укладення
- •7. Список літератури
- •8. Додаток
- •1 Вступ
- •2. Проблемна область
- •3. Попереднє дослідження
- •4. Проблемне формулювання
- •4.1. Найгірша кількість справ, що розглядаються у визначений період
- •4.2. Послідовне балансування навантаження
- •4.3. Оптимальні схеми відновлення
- •5. Головні результати
- •5.1. Комп'ютерні ланцюги
- •5.2. Приклад послідовності
- •5.3. Нормальні послідовності
- •5.4. Приклади: Голомбо, Ощадливий і послідовності модуля
- •5.5. Наваньаження компенсації ланцюгами
- •6. Напруженість mv
- •6.1. Алгоритм
- •7. Обговорення і укладення
- •8. Список літератури
3 Баланс Навантаження і толерантність дефекту (Частина 2)
Ця частина відображає роботу, пов'язану з повторним поширенням робочого навантаження для толерантності дефекту системи і визначення і класифікація дефектів.
Важливе питання у багатопроцесорній системі - те, як перерозподілити робоче навантаження у випадку дефекту між одним або більше процессорами. У такому разі завантаження треба перерозподілити
на інші процесори в максимальній рівновазі завантаження.
Проблема балансу наванаження може бути дескриптором динамічних алгоритмів розподілу ресурсів, де передача рішення залежить від фактичного поточного системного стану, або статичних алгоритмів розподілу ресурсів, які є загалом засновані на інформації середньої поведінки системи. Передача рішення є незалежною від фактичного поточного системного стану. Це робить їх менш складними,ніж динамічні алгоритми розподілу ресурсів
Система толерантності дефекту - "якщо незважаючи на програми може належним чином виконуватися подія логічних дефектів". Крішна і Шін визначають толерантність дефекту як "здатність системи, відповісти граціозно на несподіване технічне забезпечення чи програмну помилку". Тому, існує багато відмовостійких обчислювальних систем з дзеркальними операціями: наприклад, кожна операція виконується на двох або більше подвійних системах в тому сенсі, що, якщо один терпить невдачу, інший може прийняти його роботу. У цій техніці також використано кластери Фістер, [54]. У Крістіана, [14] толерантність дефекту для поширюваного обчислення обговорюється з різних точок зору. Окрім апаратних відмов, переривчасті відмови можуть відбуватися із-за програмного забезпечення події. У Вайді, [61] "дворівнева" схема відновлення представлена і оцінена. Схема відовлення була здійснена на групі. Автори оцінюють дію в часі очікування контрольної точки на виконанні схеми відовлення. Для операційно-орієнтованих систем, ГІленб [22] запропонував "підхід багатьох перевірочних точок», подібний до багаторівневої схеми відовлення що був показаний [61]. Математична модель операційно-орієнтованої системи для переривчастих відмов пропонується Чаблідогом і Гілєнбом [24]. Тут система працює по схемі «стандартного відновленя по тестовим очкам». Чаблідога і Гілєнб [9 і 23] пропонують декілька алгоритмів, які можуть виявити відмови завдань і повторний запуск невдалих завдання. Вони аналізують поведінку паралельних програм, представлених випадковим графіком завдань у багатопроцесорному середовищі. Проте, усі ці алгоритми діють динамічно.
Якщо єдиний елемент технічного забезпечення або програмного забезпечення терпить невдачу і система чере це також збоїть, ми називаємо це «єдиний покажчик відмови» (Фістер, 54). У дисертації ми дивимося на більш покращений сценарій, де може відбуватися довільний ряд дефектів, тобто ми розглядаємо систему без єдиного покажчика відмови. (відмовостійку)
3.1 Модель Дефекту
Відмова - "подія, яка відбувається, коли доручена служба відхиляється від правильної
служби". "Відхилення - помилка". "Помилка що з’явилась або про неї було оголошено ми називаємо «дефект»". Події можуть бути представлені, як в Мал. 3.
Авізеніс [3] показував елементарні класи дефекту згідно з восьмома основними точками зору : фаза створення або події, системних меж, феноменологічної причини, міра, мета, намір, можливість і постійність, де кожна з точок зору складається з двох додаткових точок зору. Якщо б усі комбінації були можливі тоді це б склало б 256 різних комбінованих класів ([3]) дефекту.
Класифікація поведінки дефекту процесорів або диспетчерів комунікації така:
- збійний дефект - процесор зупиняється при обчисленні доручення передачі;
- дефект викреслювання - пропустивши доручення, процесор втрачає свій вміст;
- Дефект затримки - повідомлення прибуває надто пізно або рано;
- дефект, що застопорюється при помилках, - доручення утримується від виконання, можливо назавжди;
- Візантійський дефект - процесор, можливо, робить що-небудь (Cristian, [14]).
З точки зору появи подій, дефекти можуть бути класифіковані:
- швидкоплинний дефект - дефект починається в специфічний час, залишається в системі для чогось і зникає;
- постійний дефект - дефект починається в специфічний час і залишається в системі, допоки його не відремонтують;
- переривчастий дефект (плаваючий) – то з’являється то зникає.
Основну увагу просимо вас звернути на Статті 3 і 4, що присвячені перманентним збоям.