- •Введение
- •Управление ресурсами: общие сведения
- •Управление процессами
- •2.1 Состояния процессов и переходы между ними
- •Стратегии и дисциплины планирования загрузки процессоров
- •Стратегия одинакового среднего времени ожидания
- •Дисциплина планирования fifo
- •Справедливая стратегия
- •Дисциплина планирования rr
- •Влияние величины кванта времени на величину средней задержки ответа
- •Стратегия максимальной пропускной способности
- •Дисциплина планирования sjf
- •Дисциплина планирования srt
- •Дисциплина планирования hrrn
- •Стратегия приоритетного планирования
- •Дисциплина лотерейного планирования
- •Дисциплины планирования с множеством очередей
- •Планирование с последовательным прохождением очередей
- •Дисциплина планирования vrr
- •Планирование на основе множества очередей с обратными связями
- •2.3 Планирование в многопользовательской системе – справедливое планирование
- •2.4 Планирование загрузки процессоров в операционных системах реального времени – частотно-монотонное планирование
- •2.5 Планирование загрузки процессоров в многопроцессорных системах
- •Многопроцессорная система с главным процессором
- •Организация с собственным планировщиком для каждого процессора
- •Симметричная многопроцессорная организация (smp)
- •Разбиение системных таблиц
- •Смещение моментов прерывания таймера
- •Стратегия планирования загрузки процессоров в многопроцессорной системе
- •Стратегия распределения загрузки
- •Стратегия максимальной производительности при параллельных вычислениях – бригадное планирование
- •Метод расщепление цикла
- •Метод редукции высоты дерева
- •Параллельное вычисление по альтернативным ветвям
- •Бригадное планирование процессов в многопроцессорной системе
- •2.6 Синхронизация выполнения процессов
- •Алгоритмы взаимоисключения с активным ожиданием
- •Алгоритм 1
- •Алгоритм 2
- •Алгоритм 3
- •Алгоритм 4
- •Алгоритм 5
- •Алгоритм Деккера
- •Алгоритм Петерсона
- •Алгоритм на основе команды процессора "проверить и установить"
- •Алгоритм на основе команды процессора "обменять данные"
- •Недостатки алгоритмов с активным ожиданием
- •Алгоритмы взаимоисключения с блокировкой процессов
- •Открытие объекта синхронизации
- •Закрытие объекта синхронизации
- •Вхождение в критическую секцию
- •Выход из критической секции
- •Замечания по реализации примитивов синхронизации
- •Мониторы
- •2.7 Взаимная блокировка процессов (тупики)
- •Необходимые условия возникновения тупика
- •Методы борьбы с тупиками
- •Предотвращение тупиков
- •Нарушение ожидания дополнительных ресурсов
- •Нарушение неперераспределимости ресурсов
- •Нарушение условия кругового ожидания
- •Устранение тупиков
- •Обнаружение тупиков
- •Управление памятью
- •3.1 Иерархическая модель памяти
- •Оценка среднего времени доступа к данным при использовании многоуровневой модели памяти
- •Локализация ссылок при обращении к памяти
- •3.2 Виртуальная память
- •Предпосылки создания виртуальной памяти
- •Архитектура виртуальной памяти
- •Подсистема трансляции адресов
- •Метод прямого отображения
- •Метод ассоциативного отображения
- •Метод комбинированного отображения
- •Архитектура виртуального адресного пространства
- •Сегментная организация виртуальной памяти
- •Страничная организация виртуальной памяти
- •Сегментно-страничная организация виртуальной памяти
- •Отображение файла на виртуальное адресное пространство
- •Совместное использование данных в оперативной памяти
- •3.3 Основные стратегии управления памятью
- •Стратегии выборки данных
- •Стратегии размещения данных
- •Выделение памяти по стратегии первого подходящего
- •Выделение памяти по стратегии наиболее подходящего
- •Выделение памяти по стратегии наименее подходящего
- •Стратегии замещения данных
- •Замещение с немедленной перезаписью и замещение с буферизацией
- •Замещение с локальной и глобальной областью видимости
- •3.4 Управление виртуальной памятью
- •Выборка в системе виртуальной памяти
- •Реализация выборки по требованию
- •Размещение в системе виртуальной памяти
- •Замещение в системе виртуальной памяти
- •Стратегия выталкивания случайной страницы
- •Оптимальная стратегия
- •Дисциплина fifo – выталкивание наиболее старой страницы
- •Дисциплина lru – выталкивание дольше всего неиспользуемой страницы
- •Дисциплина lfu – выталкивание страницы с наименьшей частотой обращений
- •Дисциплина nru – выталкивание страницы, не используемой в последнее время
- •Часовой алгоритм
- •Управление резидентным множеством страниц процесса
- •Понятие рабочего множества страниц процесса
- •Управление резидентными множествами на основе рабочих множеств
- •Глобальное замещение, динамическое резидентное множество
- •Локальное замещение, фиксированное резидентное множество
- •Локальное замещение, динамическое резидентное множество
- •Алгоритм на основе оценки частоты прерываний – дисциплина pff (Page Fault Frequency)
- •Алгоритм с переменным пробным интервалом – дисциплина vsws
- •Влияние размера страницы
- •Оптимизация работы дискового накопителя
- •Оптимизация механических перемещений головок диска
- •Основы устройства и функционирования дисковых накопителей
- •Стратегии оптимизации механических перемещений головок диска
- •Стратегия fcfs – Fist Come First Served
- •Стратегия sstf – Shortest Seek Time First
- •Стратегия scan – Scanning
- •Стратегия n-step scan – n-step Scanning
- •Системный дисковый кэш
- •Структура системного дискового кэша
- •Хэширование, хэш-функции и хэш-очереди
- •Структура блока и очередей дискового кэша
- •Работа системного дискового кэша
- •Упреждающее чтение
- •Реализация дискового кэша на основе виртуальной памяти
- •3.6 Надежность операционной системы при использовании системного дискового кэша
- •Буферизация ввода-вывода на пользовательском уровне
- •3.7 Процессорный кэш
- •Отображение участков озу на процессорный кэш
- •Случайное отображение участков озу в процессорный кэш
- •Детерминированное отображение участков озу в процессорный кэш
- •Комбинированное отображение участков озу в процессорный кэш
- •Работа процессорного кэша в режиме записи данных
- •3.8 Динамическое распределение памяти
- •Куча (heap)
- •Алгоритмы динамического распределения памяти
- •Отложенное объединение свободных блоков
- •Оптимизация списка свободных блоков
- •Метод парных меток для поддержания списка блоков кучи
- •Специальные алгоритмы динамического распределения памяти из кучи
- •Метод близнецов (или метод двойников)
- •Алгоритм выделения блоков памяти одинакового размера
- •Заключение
- •Библиографический список
- •Оглавление
- •394026 Воронеж, Московский просп., 14
Метод расщепление цикла
Достаточно часто выполнение цикла сводится к простому повторению определенных действий над некоторыми независимыми данными с независимым сохранением результатов каждой итерации, например, как показано в следующем фрагменте кода.
for (i = 0; i < N; ++i) A[i] = B[i] + C[i];
Очевидно, что подобный цикл может быть легко разделен на два независимых цикла следующим образом:
for (i = 0; i < N/2; ++i) A[i] = B[i] + C[i];
for (i = N/2; i < N; ++i) A[i] = B[i] + C[i];
При наличии двух процессоров, оба цикла могут выполняться одновременно. При наличии большего числа процессоров, цикл легко разделит на большее количество независимых более коротких циклов. В этом и состоит идея расщепления цикла.
Расщепление цикла очень легко явно реализовать в программе, при этом может быть получен весьма ощутимый выигрыш в скорости работы.
Метод редукции высоты дерева
Скрытую возможность распараллеливания вычислений зачастую можно обнаружить в простых арифметических выражениях. Обычно компиляторы раскрывают арифметические выражения, основываясь только на приоритетах операций: сначала операции в скобках, затем операции умножения и деления и, наконец, операции сложения и вычитания. В результате определяется последовательный порядок действий для нахождения результата.
Однако, используя коммутативные и ассоциативные свойства арифметических выражений можно в ряде случаев перейти к параллельным вычислениям.
Например, рассмотрим следующее выражение . Обычный порядок действий при его вычислении показан на рис. 11 слева.
Однако, указанное выражение можно переписать как и выполнить, как показано на рис. 11 справа.
Рис.11. Редукция высоты дерева вычислений
В результате вместо четырех действий мы получили шесть, но многие действия теперь могут выполняться параллельно, так что высота дерева сократилась с 4 до 3 последовательных операций.
Безусловно, если числа являются просто числами, то описанный пример не имеет особого смысла – затраты на порождение параллельных процессов превзойдут выигрыш от параллельных вычислений, но если представляют собой более сложные объекты, например матрицы большой размерности, то выигрыш от параллельной обработки может быть ощутимым.
Параллельное вычисление по альтернативным ветвям
Практически все программы содержат в своем коде ветвления, предусматривающие альтернативные пути исполнения программы, в зависимости от сложившихся условий.
Принять окончательное решение о том, какую именно ветвь вычислений следует использовать, можно только после вычисления условия ветвления, однако, если в компьютере есть избыток процессоров, то можно заранее выполнить вычисление по всем альтернативным ветвям, а когда будет получено условие, просто воспользоваться полученным результатом для требуемой ветви.
Такой подход известен, как правило “никогда не ждать”. Его применение может сократить время выполнения практически любой программы, но за счет резкого возрастания объема вычислений.
Для сокращения накладных расходов можно выполнять вычисления не для всех, а только для наиболее вероятных альтернативных ветвей. Безусловно, иногда может сложиться ситуация, что вычисление для требуемой ветви не было сделано заранее, но если прогнозирование ветвления будет верным в большинстве случаев, то выигрыш в скорости выполнения программы все равно будет получен, а накладные расходы сократятся по сравнению с предварительным расчетом по всем ветвям.