Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
питання_колокв_2_арх_ОС.doc
Скачиваний:
1
Добавлен:
11.09.2019
Размер:
155.65 Кб
Скачать
  1. Описати режим користувача та супервізора.

Одной из важнейших особенностей является обеспечение защиты информации от несанкционированного доступа путем организации возможности работы в одном из двух режимов: пользователя и супервизора.

В режиме пользователя программе были доступны регистры программной модели пользователя и большая часть инструкций.

В режиме супервизора в дополнение к регистрам программной модели пользователя становились доступны регистры программной модели супервизора, а также дополнительные инструкции, влияющие на безопасность системы.

  1. Дати визначення механізму снупінга, його дії.

Механизм снупинга позволяет альтернативному владельцу магистрали получать доступ к содержимому внутрикристального кэша данных.

Система арбитра, служащая для определения владельца магистрали, включает сигналы:

  • запроса магистрали;

  • передачи управления магистралью;

  • подтверждения приема магистрали.

  1. Дати визначення сопроцесору.

Сопроцессор - это специализированная интегральная схема, которая работает в содружестве с ЦП, но менее универсальна. В отличие от ЦП, сопроцессор не имеет счетчика команд. Сопроцессор предназначен для выполнения специфического набора функций, например: выполнение операций с вещественными числами - математический сопроцессор, подготовка графических изображений и трехмерных сцен - графический сопроцессор, цифровая обработка сигналов - сигнальный сопроцессор и др.

  1. Назвати методи обміну інформацією між процесором та сопроцесором.

  • прямое соединение входных и выходных портов (ЦП имеет специальный интерфейс для взаимодействия с сопроцессором);

  • с обменом через память (обмен информацией между ЦП и сопроцессором происходит благодаря доступу сопроцессора к оперативной памяти через системную магистраль).

  1. Назвати функції математичного сопроцесора.

Один из наиболее распространенных типов сопроцессоров - математический сопроцессор. Математический сопроцессор предназначен для быстрого выполнения арифметических операций с плавающей точкой, предоставления часто используемых вещественных констант (, log210, log2e, ln2, :), вычисления тригонометрических и прочих трансцендентных функций (tg, arctg, log, ...).

  1. Записати формати чисел з плаваючою крапкою за стандартом IEEE-754.

Большинство современных математических сопроцессоров для представления вещественных чисел используют стандарт IEEE 754-1985 "IEEE ( Institute of Electrical and Electronics Engineers - Институт инженеров по электротехнике и электронике) Standard for Binary Floating-Point Arithmetics". Старший разряд двоичного представления вещественного числа всегда кодирует знак числа. Остальная часть разбивается на две части: экспоненту и мантиссу. Вещественное число вычисляется как:

(-1)S·2E·M,

где S - знаковый бит числа, E - экспонента, M - мантисса. Если 1M<2, то такое число называется нормализованным.

  1. Записати визначення кеш – та оперативної пам’яті.

Кэш используется для согласования скорости работы ЦП и основной памяти. В вычислительных системах используют многоуровневый кэш: кэш I уровня (L1), кэш II уровня (L2) и т.д. В настольных системах обычно используется двухуровневый кэш, в серверных - трехуровневый. Кэш хранит команды или данные, которые с большой вероятностью в ближайшее время поступят процессору на обработку. Работа кэш-памяти прозрачна для программного обеспечения, поэтому кэш-память обычно программно недоступна.

Оперативная память хранит, как правило, функционально-законченные программные модули (ядро операционной системы, исполняющиеся программы и их библиотеки, драйверы используемых устройств и т.п.) и их данные, непосредственно участвующие в работе программ, а также используется для сохранения результатов вычислений или иной обработки данных перед пересылкой их во внешнее ЗУ, на устройство вывода данных или коммуникационные интерфейсы.

  1. Записати методи запису для узгодження вмісту пам’яті.

  • Сквозная запись (write through) - одновременно с кэш-памятью обновляется оперативная память.

  • Буферизованная сквозная запись (buffered write through) - информация задерживается в кэш-буфере перед записью в оперативную память и переписывается в оперативную память в те циклы, когда ЦП к ней не обращается.

  • Обратная запись (write back) - используется бит изменения в поле тега, и строка переписывается в оперативную память только в том случае, если бит изменения равен 1.

  1. Записати типи кеш-пам’яті.

  • полностью ассоциативный кэш;

  • кэш прямого отображения;

  • множественный ассоциативный кэш

  1. Записати основні особливості RISC-процесорів.

  1. Сокращенный набор команд (от 80 до 150 команд).

  2. Большинство команд выполняется за 1 такт.

  3. Большое количество регистров общего назначения.

  4. Наличие жестких многоступенчатых конвейеров.

  5. Все команды имеют простой формат, и используются немногие способы адресации.

  6. Наличие вместительной раздельной кэш-памяти.

  7. Применение оптимизирующих компиляторов, которые анализируют исходный код и частично меняют порядок следования команд.

  1. Назвати області використання RISC-процесорів.

  • рабочие станции высшего ценового класса (12-15 тысяч долларов). Работают под ОС VMS, Unix;

  • персональные рабочие станции (3-7 тыс. $). ОС: Windows NT, Solaris;

  • серверы;

  • RISC ПК.

  1. Записати основні функціональні блоки процесора Alpha.

  • I-cache - кэш команд.

  • IRF - регистровый файл целочисленной арифметики.

  • F-box - устройство арифметики с плавающей точкой.

  • E-box - устройство целочисленной арифметики (7 ступеней конвейера).

  • I-box - командное устройство (управляет кэш команд, выборкой и дешифрацией команд).

  • A-box - устройство управления загрузкой/сохранением данных. Управляет процессом обмена данными м/у IRF, FRF, кэш данных и внешней памятью.

  • Write Buffer - буфер обратной записи.

  • D-cache - КЭШ данных.

  • BIU - интерфейсный блок, с помощью которого подключаются внешняя кэшпамять, размером 128 Кб-8 Мб.

  1. Записати архітектурні особливості процесора РА-8000.

Процессор PA-8000 вобрал в себя все известные методы ускорения выполнения команд. В его основе лежит концепция "интеллектуального выполнения", которая базируется на принципе внеочередного выполнения команд. Это свойство позволяет PA-8000 достигать пиковой производительности благодаря широкому использованию механизмов автоматического разрешения конфликтов по данным и управлению аппаратными средствами. Эти средства хорошо дополняют другие архитектурные компоненты, заложенные в структуру кристалла: большое число исполнительных функциональных устройств, средства прогнозирования направления переходов и выполнения команд по предположению, оптимизированная организация кэш-памяти и высокопроизводительный шинный интерфейс.

Высокая производительность PA-8000 во многом определяется наличием большого набора функциональных устройств. В состав PA-8000 входят 10 исполнительных устройств: два арифметико-логических устройства (АЛУ) для выполнения целочисленных операций, два устройства для выполнения операций сдвига/слияния данных, два устройства для выполнения умножения/сложения чисел с плавающей точкой, два устройства деления/вычисления квадратного корня и два устройства выполнения операций загрузки/записи.

Средства внеочередного выполнения команд процессора PA-8000 обеспечивают аппаратное планирование загрузки конвейеров и лучшее использование функциональных устройств. В каждом такте на выполнение могут выдаваться до четырех команд, которые поступают в 56-строчный буфер переупорядочивания. Этот буфер позволяет поддерживать постоянную занятость функциональных устройств и обеспечивает эффективную минимизацию конфликтов по ресурсам.

Кристалл может анализировать все 56 командных строк одновременно и выдавать в каждом такте по 4 готовых для выполнения команды в функциональные устройства. Это позволяет процессору автоматически выявлять параллелизм уровня выполнения команд.

  1. Записати способи паралельної обробки даних.

Параллельная обработка данных имеет две разновидности: конвейерность и параллельность.

Идея конвейерной обработки заключается в выделении отдельных этапов выполнения общей операции, причем так, чтобы каждый этап, выполнив свою работу, передавал бы результат следующему, одновременно принимая новую порцию входных данных. Выигрыш в скорости обработки данных получается за счет совмещения прежде разнесенных во времени операций.

Параллельная обработка данных предполагает наличие нескольких функционально независимых устройств.

  1. Назвати класи паралельних систем.

I. Векторно-конвейерные компьютеры (PVP). Имеют MIMD-архитектуру (множество инструкций над множеством данных).

II. Массивно-параллельные компьютеры с распределенной памятью. Объединяется несколько серийных микропроцессоров, каждый со своей локальной памятью, посредством некоторой коммуникационной среды.

III. Параллельные компьютеры с общей памятью (SMP). Вся оперативная память разделяется между несколькими одинаковыми процессорами.

IV. Кластерная архитектура. Кластерная архитектура представляет собой комбинации предыдущих трех.

  1. Записати тест оцінки продуктивності супер ЕОМ.

Наиболее популярным тестом производительности является Linpack, который представляет собой решение системы N линейных уравнений методом Гаусса. Так как известно, сколько операций с вещественными числами нужно проделать для решения системы, то, зная время расчета, можно вычислить выполняемое в секунду количество операций.

Имеется несколько модификаций этих тестов. Обычно фирмы-производители компьютеров приводят результаты при N = 100.

Свободно распространяется стандартная программа на Фортране, которую надо выполнить на суперкомпьютере, чтобы получить результат тестирования. Эта программа не может быть изменена, за исключением замены вызовов подпрограмм, дающих доступ к процессорному времени выполнения.

Другой стандартный тест относится к случаю N = 1000, предполагающему использование длинных векторов. Эти тесты могут выполняться на компьютерах при разном числе процессоров, давая также оценки качества распараллеливания.

Для MPP-систем более интересным является тест Linpack-parallel, в котором производительность измеряется при больших N и большом количестве процессоров.

Для высокопараллельных суперкомпьютеров в последнее время все больше используются тесты NAS parallel benchmark, которые особенно хороши для задач вычислительной газо- и гидродинамики. Их недостатком является фиксация алгоритма решения, а не текста программы.

  1. Записати фактори, які знижують продуктивність паралельних комп’ютерів.

  1. Закон Амдала.

2. Время инициализации посылки сообщения (латентность) и время передачи сообщения по сети. Максимальная скорость передачи достигается на больших сообщениях, когда латентность, возникающая лишь вначале, не столь заметна на фоне непосредственно передачи данных.

3. Возможность асинхронной посылки сообщений и вычислений.

Если или аппаратура, или программное обеспечение не поддерживают возможности проводить вычисления на фоне пересылок, то возникнут неизбежные накладные расходы, связанные с ожиданием полного завершения взаимодействия параллельных процессов.

4. Неравномерная загрузка всех процессорных элементов. Если равномерности нет, то часть процессоров будут простаивать, ожидая остальных, хотя в этот момент они могли бы выполнять полезную работу.

5. Время ожидания прихода сообщения. Для его минимизации необходимо, чтобы один процесс отправил требуемые данные как можно раньше, отложив независящую от них работу на потом, а другой процесс выполнил максимум работы, не требующей ожидаемой передачи, прежде чем выходить на точку приема сообщения.

6. Реальная производительность одного процессора.

  1. Записати основні переваги МРІ.

  • поддержка нескольких режимов передачи данных;

  • предусматривает гетерогенные вычисления;

  • передача типизированных сообщений;

  • построение библиотек - MPICH, LAM MPI;

  • наличие вариантов для языков программирования C/C++, Fortran;

  • поддерживает коллективные операции: широковещательную передачу, разборку/сборку, операции редукции;

  • совместимость с многопоточностью.

  1. Дати визначення VLIW, особливості.

VLIW - это набор команд, реализующий горизонтальный микрокод. Несколько (4-8) простых команд упаковываются компилятором в длинное слово. Такое слово соответствует набору функциональных устройств. VLIW-архитектуру можно рассматривать как статическую суперскалярную архитектуру, поскольку распараллеливание кода производится на этапе компиляции, а не динамически во время исполнения. То есть в машинном коде VLIW присутствует явный параллелизм.

Выделение в архитектуре VLIW компонентов командного слова, управляющих отдельными блоками МП, вводит явный параллелизм на уровне команд. Задача обеспечения эффективного распараллеливания работы отдельных блоков возлагается при этом на компилятор, который должен сгенерировать машинные команды, содержащие явные указания на одновременное исполнение операций в разных блоках. Таким образом, достижение параллелизма, обеспечиваемое в современных суперскалярных RISC-процессоров их аппаратурой, в VLIW возлагается на компилятор.

  1. Дати визначення ЕРІС, записати архітектурні особливості.

EPIC – технология явного параллелизма на уровне команд (EPIC - Explicitly Parallel Instruction Computing). Особенности EPIC:

  • Большое количество регистров.

  • Масштабируемость архитектуры до большого количества функциональных устройств. Это свойство представители фирмы Intel и HP называют "наследственно масштабируемый набор команд".

  • Явный параллелизм в машинном коде. Поиск зависимостей между командами производит не процессор, а компилятор.

  • Предикация. Команды из разных ветвей условного ветвления снабжаются предикатными полями (полями условий) и запускаются параллельно.

  • Загрузка по предположению. Данные из медленной основной памяти загружаются заранее.