
- •1.Классификация и характеристики мп.
- •Вопрос 2. Организация доступа к программно доступным элементам
- •Билет№2
- •1.Оценка производительности мп.
- •2.Программно-управляемый обмен.
- •1.Общая структура Фон-Неймановской архитектуры.
- •2.Обмен в режиме прерываний. Инициализация подсистемы прерывания.
- •Билет№4
- •1.Устройство управления мп.
- •2.Обмен в режиме прерываний. Алгоритм обмена.
- •Билет№5
- •1.Операционное устройство мп.
- •2.Обмен данными в режиме пдп. Инициализация.
- •1.Принцип конвейерной обработки. Производительность, проблемы.
- •2.Обмен данными в режиме пдп. Алгоритм обмена.
- •1.Структурные конфликты. Методы минимизации конфликтов.
- •2.Обмен в режиме прерываний. Алгоритм обмена.
- •1.Конфликты по данным. Методы минимизации конфликтов.
- •2.Организация доступа к программно-доступным элементам.
- •1.Конфликты по управлению. Статические методы минимизаций конфликтов.
- •2.Программно-управляемый обмен.
- •1.Конфликты по управлению. Динамические методы минимизаций конфликтов.
- •2.Суперскалярная обработка. Приминение. Проблемы.
- •1.Пути повышения производительности мп. Особенности высокоскростных мп.
- •2.Обмен в режиме прерываний. Инициализация подсистемы прерываний.
- •2.Операционное устройство мп.
- •1.Обмен данными в режиме пдп. Инициализация.
- •Аппаратный стек мп
- •1.Обмен данными в режиме пдп. Алгоритм обмена.
- •2.Оценка производительности мп.
- •1.Программно-управляемый обмен.
- •2.Организация доступа к программно-доступным элементам.
- •4, 8, 12, 16, 24, 32 И 64 разрядные мп
- •2.Обмен в режиме прерываний. Инициализация подсистемы прерывания.
- •Билет№18
- •1.Оценка производительности мп.
- •2.Обмен в режиме прерываний. Алгоритм обмена.
2.Суперскалярная обработка. Приминение. Проблемы.
Загрузка суперскалярного процессора
Для обеспечения 100% загрузки всех FU суперскалярного процессора необходима длинная последовательность независимых инструкций с удачным соотношением типов инструкций. Длина такой последовательности должна быть не менее глубины конвейера умноженной на количество FU. Однако типичный размер ББИ около семи инструкций.
Повышение степени ILP для суперскалярного процессора осуществляется:
1 оптимизирующим компилятором в статическом режиме
2 переупорядочиванием инструкций аппаратным планировщиком в
динамическом режиме.
Динамическое переупорядочивание позволяет обрабатывать случаи, когда зависимости между инструкциями неизвестны во время компиляции
(например, возможное перекрытие двух указателей, значения которых получены во время исполнения).
Неупорядоченные выдача и завершение – неупорядоченная модель обработок – дополнительный потенциал повышения производительности суперскалярного процессора. Современныесуперскалярные CPU исполняют от 2 до 10 инструкций за такт и используют аппаратную логику анализа ILP (instructionlevelparallelism) перед выдачей команд. Такой аппаратный механизм переупорядочивания исполнения инструкций (out-of-orderengine) называется динамическим планированием. Компилятор и динамический планировщик не могут обойти все конфликты (структурные, по данным, по управлению) и задержки доступа к памяти (при кеш-промахах).
Билет№11
1.Пути повышения производительности мп. Особенности высокоскростных мп.
Источником повышения производительности является оптимизация загрузки всех функциональных модулей процессора. Существует два подхода к этой проблеме:
-Оптимизация загрузки обеспечивается аппаратно процессором. Такой процессор называется суперскалярным. Особенности:
- совместимость на уровне кода с обычным конвейерным МП
- сложное УУ. Причем сложность растет экспоненциально от количества функциональных модулей
2) Оптимизация осуществляется компилятором: исходные команды упаковываются в длинное командное слово, части которого являются командами для каждого функционального блока процессора. Такой МП называется VLIW (verylonginstructionword). Особенности:
- несовместим на уровне кода с конвейерным МП
- простое УУ, и, как следствие, большая производительность при прочих равных
С целью повышения производительности процессора часто используется метод конвейеризации команд, т.е. необходимо организовать непрерывное выполнение потока команд. Тогда для выполнения одной команды потребуется время, затрачиваемое на прохождение одной ступени конвейера (в идеальном случае).
SimultaneousMultithreading (SMT) – эволюционная микропроцессорная архитектура 1995 году в университетархитектура, впервые представленная в университете Вашингтона ДиномТулсеном.
Изменения для повышения производительности SMT
1. Больший регистровый файл для поддержки переименования регистров
2. Большая пропускная способность доступа к памяти
3. Большие кеши для компенсации снижения производительности из-за совместного использования несколькими потоками (из-за снижения локальности)
4. Больший BTB (буфер ветвлений)
5. Больший TLB (буфер быстрого преобразования адреса)