
- •Содержание
- •История развития и классификация эвм (Лекция 1) Понятие архитектуры эвм
- •Классификация эвм
- •История развития эвм
- •Универсальные и управляющие эвм
- •Программное обеспечение
- •Архитектура системных плат (Лекция 2)
- •Шины ввода-вывода (xt, isa, eisa, mca, vesa, pci).
- •Сравнение и характеристики шин.
- •Основные микросхемы ibm pc
- •Микропроцессоры (Лекция 3)
- •Классификация процессоров
- •Общая организация современного микропроцессора
- •Исполнение процессорами инструкций x86 и x64 (Лекция 4) Кэш инструкций
- •Предсказание переходов
- •Исполнение инструкций
- •Процессоры Intel Pentium III, Pentium m и Core Duo
- •Внеочередное исполнение операций, функциональные устройства
- •Система прерываний (Лекция 5) Организация обработки прерываний в эвм
- •Обработка прерываний в персональной эвм.
- •Память (Лекция 6) Определения
- •Система управления памятью
- •Память. Микросхемы sdram (Лекция 7). Организация и принципы работы.
- •Физическая организация
- •Организация модулей памяти sdram
- •Микросхема spd
- •Тайминги памяти
- •Соотношения между таймингами
- •Схемы таймингов
- •Задержки командного интерфейса
- •Ddr/ddr2 sdram: Отличия от sdr sdram
- •Накопители информации. (Лекция 8) Эволюция носителей информации.
- •Управление распределением диска.
- •Структура таблицы разделов
- •Периферийные устройства (Лекция 9) Kлaвиaтуpa и управление клавиатурой
- •Сводная таблица скан-кодов
- •Клавиши пишущей машинки
- •Cвoднaя тaблицa кoдoв ascii
- •Сводная таблица расширенных кодов.
- •Визуализация данных (Лекция 10) Устройство видеомонитора.
- •Эволюция видеоадаптеров
- •Основа архитектуры видеоадаптеров
- •Установка атрибутов/цветов символов.
- •Управление курсором.
- •Ввод/вывод. (Лекция 11)
- •Особенности pio и dma
- •Доступ к последовательному порту.
- •Программирование микросхемы uart 8250.
- •Инициализация последовательного порта.
- •Установка текущего коммуникационного порта.
- •Инициализация и управление модемом.
- •Печатающие устройства. Принтеры. (Лекция 12) Классификация печатающих устройств
- •Управление работой принтера.
- •Посылка данных на принтер.
- •Параллельные вычислительные процессы и системы (Лекция 13) Виды параллелизма
- •Реализация параллельных систем
- •Нейровычислительные системы.
- •Сложности использования параллельных систем
- •Программирование параллельных систем
- •Сети эвм (Лекция 14) Организация сети
- •Характеристики стеков коммуникационных протоколов
- •Стек tcp/ip
- •Типовой состав оборудования локальной сети (Лекция 15)
- •Кабельная система
- •Сетевые адаптеры
- •Повторители и концентраторы
- •Мосты и коммутаторы
- •Маршрутизаторы
- •Список литературы
- •Список тем рефератов по курсу «Архитектура эвм»
- •Список вопросов к экзамену по предмету «Архитектура эвм».
Исполнение процессорами инструкций x86 и x64 (Лекция 4) Кэш инструкций
Во всех современных микроархитектурах, за исключением процессора P-4, кэш инструкций (I-кэш) организован классическим образом.
Кэш 1-го уровня (L1-кэш) имеет размер 32 Кбайт и состоит из блоков по 64 байта, организованных в виде 64 наборов по 8 блоков. Для поиска требуемого элемента данных в кэше используется комбинированный алгоритм, сочетающий прямую адресацию по нескольким разрядам адреса с ассоциативным поиском. Младшие 6 разрядов адреса b5-0 указывают положение байта в 64-байтовом блоке и для поиска блока не используются. Следующие 6 разрядов адреса b11-6 указывают номер набора, а нахождение требуемого блока в наборе осуществляется сравнением самых старших разрядов адреса (ключа) с соответствующими разрядами адреса, хранящимися для каждого блока в наборе (тэгами). Таким образом, элемент данных по какому-либо адресу может располагаться в рассматриваемом кэше в одном из 8 блоков конкретного набора.
Если нужный блок данных не найден в L1-кэше, он ищется в кэше второго уровня (L2-кэше), и далее, если не найден и там, в оперативной памяти. Затем этот блок записывается в L1-кэш. Если все блоки в наборе уже заняты, то один из блоков удаляется (вытесняется). Как правило, для вытеснения используется алгоритм LRU (Least Recently Used — «наименее используемый в последнее время»).
Описанная организация кэша называется «наборно-ассоциативной» (set-associative). Число блоков в наборе (в данном случае 8) называется уровнем ассоциативности кэша. Оно определяет, сколько блоков данных, отстоящих друг от друга на расстоянии с определённой кратностью (в данном случае – кратном 4 Кбайт), может одновременно находиться в кэше. Данное ограничение называют проблемой алиасинга. Чем выше уровень ассоциативности, тем меньше вероятность, что различные блоки данных столкнутся с алиасингом. Например, у L1-кэшей процессора K8 уровень ассоциативности равен 2 при размере 64 Кбайт, а I-кэш процессора PPC970 имеет уровень ассоциативности, равный 1 при том же размере 64 Кбайт (такая организация называется прямым отображением), и состоит из блоков по 128 байт.
Обычно поиск в кэшах осуществляется по физическому адресу элемента данных. Однако преобразование адреса из программного (логического) в физический требует определённого времени – для этого используется вспомогательная структура, похожая на небольшой кэш и называемая буфером преобразования адреса (TLB, Translation Lookaside Buffer). Поэтому для адресации набора L1-кэша, чтобы ускорить поиск, используют необходимые разряды программного адреса. В тех случаях, когда эти разряды адресуют не больше одной страницы памяти (размер которой, как правило, равен 4 Кбайт), они совпадают с соответствующими разрядами физического адреса. Например, в процессорах P-M и P8 для этого используются разряды b11-6, и данное условие соблюдается. Арифметически это условие можно выразить так: частное от деления размера кэша на уровень ассоциативности не должно превышать размера страницы. Легко видеть, что в процессорах K8 и PPC970 данное условие не соблюдается (64K/2=32K, 64K/1=64K).
В I-кэше процессора K8, помимо байтов инструкций, хранятся также так называемые биты предекодирования — по 3 разряда на байт. Их назначение будет описано в разделе про декодирование.
Инструкции считываются из I-кэша порциями (выровненными блоками), с опережающей предвыборкой, чтобы обеспечить бесперебойную работу декодера инструкций и ускорить предсказание переходов. Размер такого блока в процессорах P-III и K8 равен 16 байтам.