
- •АнНоТация
- •Оглавление
- •Введение
- •Общие принципы микроархитектуры Nehalem
- •Усовершенствованное процессорное ядро
- •Tlb и кэш-память
- •Новые sse4.2 инструкции
- •Интегрированный контроллер памяти
- •Шина qpi
- •Управление питанием и Turbo-режим
- •Первые Nehalem – это Bloomfield
- •Заключение
- •Приложение. Оперативная памятьDdr 3 Изучаем новое поколение памяти ddr sdram, теоретически и практически
- •Ddr3: некоторые технические сведения
- •Литература
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ЛИПЕЦКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
КАФЕДРА АВТОМАТИЗИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ
РЕФЕРАТ
«Микроархитектура Intel Nehalem (i7)»
|
Студент |
|
|
|
Капнин А. В. |
| ||||||||
|
|
|
подпись, дата |
|
фамилия, инициалы |
| ||||||||
|
Группа |
|
МАС-07 |
|
|
|
| |||||||
|
|
|
|
|
|
| ||||||||
|
Преподаватель |
|
|
|
Ведищев В. В. |
| ||||||||
|
|
|
подпись, дата |
|
фамилия, инициалы |
|
Липецк 2008
АнНоТация
С. 48. Табл. 4. Ил. 22. Библиогр. 6 назв. Прил.:1;
Оглавление
АННоТАЦИЯ 2
Оглавление 3
Введение 4
Общие принципы микроархитектуры Nehalem 5
Усовершенствованное процессорное ядро 10
TLB и кэш-память 18
Новые SSE4.2 инструкции 23
Интегрированный контроллер памяти 24
Шина QPI 26
Управление питанием и Turbo-режим 28
Первые Nehalem – это Bloomfield 32
Заключение 35
Приложение. Оперативная память DDR 3 38
Изучаем новое поколение памяти DDR SDRAM, теоретически и практически 38
DDR3: некоторые технические сведения 45
Табл. 1. Скоростные характеристики модулей памяти DDR3 48
Литература 50
Введение
О том, что в 2008 году
нас ждёт встреча с процессорами Intel с
новой микроархитектурой, известно очень
давно. Это стало ясно ещё два года назад,
когда компанией была представлена
концепция развития «Tick-Tock», согласно
которой каждый год меняется либо
технология производства процессоров,
либо их микроархитектура. В прошлом
году Intel представила процессоры семейства
Penryn, представляющие собой обновлённые
Core, выпуск которых был переведён на
45-нм технологический процесс с
использованием соединений гафния.
Следовательно, в этом году пришла очередь
новой микроархитектуры – Nehalem, первыми
представителями которой выступают
процессоры Bloomfield, ориентированные на
использование в настольных системах.
Рис. 1. Концепция развития «Tick-Tock»
Чередование
внедрения новых технологических
процессов и разработки новых микроархитектур
позволило компании Intel избавиться от
задержек при анонсе новых процессоров.
Поэтому ровно через год после представления
семейства Penryn мы вновь поднимаем тему
процессорных нововведений: неминуемо
приближается дата появления на рынке
процессоров с микроархитектурой
Nehalem.
Учитывая значительность этого
события, мы решили разделить наш первый
материал, посвящённый ожидаемой новинке,
на несколько частей. Сегодня мы поговорим
об особенностях архитектурных и
технологических решений, нашедших место
в перспективных процессорах, а затем
выйдет вторая часть статьи, в которой
нас будет ждать подробное знакомство
с производительностью Nehalem в реальных
задачах и другими не менее важными его
потребительскими качествами.
Общие принципы микроархитектуры Nehalem
Прежде чем начать знакомство с многообещающей микроархитектурой Nehalem, несколько слов необходимо сказать о причинах её появления. Ведь хотя её создание ведётся очень давно, вряд ли компания Intel заинтересована в скорейшем появлении процессоров на ней основанных только лишь ради вписывания в самой же сформулированный план «Tick-Tock». Очевидно, что на первый взгляд весьма успешная микроархитектура Core чем-то не удовлетворяет микропроцессорного гиганта, причём причины этого не лежат на поверхности. Процессоры Core полны преимуществ, хорошо продаются и на голову переигрывают предложения конкурента. Оказывается, существенным недостатком Core, особенно досаждающим Intel, стал их немодульный дизайн. Выступая дальнейшим развитием мобильных процессоров Pentium M, микропроцессоры Core 2 изначально проектировались как двухъядерные полупроводниковые кристаллы. Последующий же переход к выпуску многоядерных представителей семейства Core 2 стал выявлять слабые места такого подхода. Так, четырёхъядерные и недавно вышедшие шестиядерные представители микроархитектуры Core просто собирались из нескольких двухъядерных кристаллов, что приводило к затруднению взаимодействия между ними. Обмен данными между разрозненными ядрами организовывался через системную память, что порой вызывало большие задержки, обусловленные ограниченной пропускной способностью процессорной шины. Ещё одно узкое место возникало в многопроцессорных системах. Хотя Intel уже решил проблему с разделением системной шины, выпустив чипсеты, предлагающие собственную шину каждому процессору, производительность часто ограничивалась недостаточно высокой пропускной способностью шины памяти. Эту проблему, например, можно было наблюдать даже в ориентированной на энтузиастов платформе Skulltrail, не говоря уже о высокопроизводительных рабочих станциях и серверах. Иными словами, дальнейшее увеличение многоядерности и многопроцессорности, выбранное основным вектором увеличения производительности современных систем, рано или поздно должны были завести Intel в тупик, даже несмотря на то, что сама по себе современная микроархитектура Core и представляется очень удачной. Именно поэтому Intel и стремится к скорейшему переходу на Nehalem – микроархитектуру, которая в первую очередь решает описанные структурные проблемы. Ведь ключевыми особенностями Nehalem, бросающимся на вид при первом знакомстве, стали интегрированный в процессор контроллер памяти и новая шина с топологией точка-точка Quick Path Interconnects (QPI), позволяющая не только связывать процессор с чипсетом, но и несколько процессоров между собой напрямик. Все эти нововведения перекликаются со строением процессоров AMD, и это действительно так: о перспективности встраивания контроллера памяти в процессор и связывания процессоров между собой в многопроцессорных системах AMD догадалась несколько лет назад. Однако в роли догоняющего Intel выступает только в плане архитектурных улучшений: по удельной производительности процессоров она лидирует с момента выхода микроархитектуры Core. Вторым важным нововведением в Nehalem стал модульный дизайн процессора. Фактически, микроархитектура сама по себе включает лишь несколько «строительных блоков», из которых на этапе конечного проектирования и производства может быть собран итоговый процессор.
Этот набор
строительных блоков включает в себя
процессорное ядро с L2 кэшем, L3 кэш,
контроллер шины QPI, контроллер памяти,
графическое ядро и так далее.
Рис. 2. Модульный дизайн процессора
Необходимые
«кубики» будут собираться в едином
полупроводниковом кристалле и
преподноситься в качестве решения для
того или иного рыночного сегмента.
Например, процессор Bloomfield, с которым мы
встретимся в ближайшее время, включает
в себя четыре ядра, L3 кэш, контроллер
памяти и один контроллер шины QPI.
Рис. 3. Модульная структура процессора Bloomfield
Серверные же
процессоры с той же архитектурой, которые
будут представлены в начале следующего
года, будут включать до восьми ядер, до
четырёх контроллеров QPI для объединения
в многопроцессорные системы, L3 кэш и
контроллер памяти. Бюджетные же модели
семейства Nehalem, запланированные к выходу
на вторую половину следующего года,
будут располагать двумя ядрами,
контроллером памяти, встроенным
графическим ядром и контроллером шины
DMI, необходимым для прямой связи с южным
мостом. Это – далеко не все возможные
варианты, мы привели именно их лишь в
качестве иллюстрации чрезвычайной
гибкости строения Nehalem.
Новые принципы
дизайна платформ и процессоров –
существенное, но не единственное
нововведение, приходящее с внедрением
новой микроархитектуры Intel. Многие
изменения заложены и в главной составной
части процессора – непосредственно в
вычислительном ядре. Несмотря на то,
что ядра процессоров Nehalem с точки зрения
пользователя можно рассматривать лишь
как улучшенный вариант микроархитектуры
Core, в них реализовано много новых
технологий и усовершенствований.
Благодаря им процессоры Nehalem могут
похвастать и увеличившейся «чистой»
производительностью. Среди важных
нововведений необходимо отметить
появление технологии SMT (Simultaneous
Multi-Threading) – аналога памятной технологии
Hyper-Threading, позволяющей одновременно
исполнять два вычислительных потока
на одном ядре; добавление поддержки
новых команд SSE4.2; повышение результативности
механизма предсказания переходов;
увеличение размера внутренних буферов;
улучшение эффективности и скорости
работы подсистемы кэш-памяти.
Подводя
итог сказанному, обобщим основные
отличительные черты процессоров,
принадлежащих к поколению Nehalem:
Два, четыре или восемь ядер;
Усовершенствованные по сравнению с Core вычислительные ядра;
Технология SMT, позволяющая исполнять одновременно два вычислительных потока на одном ядре;
Три уровня кэш-памяти: L1 кэш размером 64 кбайта на каждое ядро, L2 кэш размером 256 кбайт на каждое ядро, общий разделяемый L3 кэш размером до 24 Мбайт;
Интегрированный контроллер памяти с поддержкой нескольких каналов DDR3 SDRAM;
Монолитная конструкция – процессор состоит из одного полупроводникового кристалла;
Технологический процесс с нормами производства 45 нм;
Возможность интегрирования в процессор графического ядра;
Новая шина QPI с топологией точка-точка для связи процессора с чипсетом и процессоров между собой;
Модульная структура.
Теперь, после
краткого знакомства с общей концепцией
новой микроархитектуры, давайте уделим
больше внимания особенностям отдельных
узлов процессоров, её использующих.