- •АнНоТация
- •Оглавление
- •Введение
- •Общие принципы микроархитектуры Nehalem
- •Усовершенствованное процессорное ядро
- •Tlb и кэш-память
- •Новые sse4.2 инструкции
- •Интегрированный контроллер памяти
- •Шина qpi
- •Управление питанием и Turbo-режим
- •Первые Nehalem – это Bloomfield
- •Заключение
- •Приложение. Оперативная памятьDdr 3 Изучаем новое поколение памяти ddr sdram, теоретически и практически
- •Ddr3: некоторые технические сведения
- •Литература
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ЛИПЕЦКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
КАФЕДРА АВТОМАТИЗИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ
РЕФЕРАТ
«Микроархитектура Intel Nehalem (i7)»
|
Студент |
|
|
|
Капнин А. В. |
| ||||||||
|
|
|
подпись, дата |
|
фамилия, инициалы |
| ||||||||
|
Группа |
|
МАС-07 |
|
|
|
| |||||||
|
|
|
|
|
|
| ||||||||
|
Преподаватель |
|
|
|
Ведищев В. В. |
| ||||||||
|
|
|
подпись, дата |
|
фамилия, инициалы |
|
Липецк 2008
АнНоТация
С. 48. Табл. 4. Ил. 22. Библиогр. 6 назв. Прил.:1;
Оглавление
АННоТАЦИЯ 2
Оглавление 3
Введение 4
Общие принципы микроархитектуры Nehalem 5
Усовершенствованное процессорное ядро 10
TLB и кэш-память 18
Новые SSE4.2 инструкции 23
Интегрированный контроллер памяти 24
Шина QPI 26
Управление питанием и Turbo-режим 28
Первые Nehalem – это Bloomfield 32
Заключение 35
Приложение. Оперативная память DDR 3 38
Изучаем новое поколение памяти DDR SDRAM, теоретически и практически 38
DDR3: некоторые технические сведения 45
Табл. 1. Скоростные характеристики модулей памяти DDR3 48
Литература 50
Введение
О том, что в 2008 году нас ждёт встреча с процессорами Intel с новой микроархитектурой, известно очень давно. Это стало ясно ещё два года назад, когда компанией была представлена концепция развития «Tick-Tock», согласно которой каждый год меняется либо технология производства процессоров, либо их микроархитектура. В прошлом году Intel представила процессоры семейства Penryn, представляющие собой обновлённые Core, выпуск которых был переведён на 45-нм технологический процесс с использованием соединений гафния. Следовательно, в этом году пришла очередь новой микроархитектуры – Nehalem, первыми представителями которой выступают процессоры Bloomfield, ориентированные на использование в настольных системах.
Рис. 1. Концепция развития «Tick-Tock»
Чередование внедрения новых технологических процессов и разработки новых микроархитектур позволило компании Intel избавиться от задержек при анонсе новых процессоров. Поэтому ровно через год после представления семейства Penryn мы вновь поднимаем тему процессорных нововведений: неминуемо приближается дата появления на рынке процессоров с микроархитектурой Nehalem. Учитывая значительность этого события, мы решили разделить наш первый материал, посвящённый ожидаемой новинке, на несколько частей. Сегодня мы поговорим об особенностях архитектурных и технологических решений, нашедших место в перспективных процессорах, а затем выйдет вторая часть статьи, в которой нас будет ждать подробное знакомство с производительностью Nehalem в реальных задачах и другими не менее важными его потребительскими качествами.
Общие принципы микроархитектуры Nehalem
Прежде чем начать знакомство с многообещающей микроархитектурой Nehalem, несколько слов необходимо сказать о причинах её появления. Ведь хотя её создание ведётся очень давно, вряд ли компания Intel заинтересована в скорейшем появлении процессоров на ней основанных только лишь ради вписывания в самой же сформулированный план «Tick-Tock». Очевидно, что на первый взгляд весьма успешная микроархитектура Core чем-то не удовлетворяет микропроцессорного гиганта, причём причины этого не лежат на поверхности. Процессоры Core полны преимуществ, хорошо продаются и на голову переигрывают предложения конкурента. Оказывается, существенным недостатком Core, особенно досаждающим Intel, стал их немодульный дизайн. Выступая дальнейшим развитием мобильных процессоров Pentium M, микропроцессоры Core 2 изначально проектировались как двухъядерные полупроводниковые кристаллы. Последующий же переход к выпуску многоядерных представителей семейства Core 2 стал выявлять слабые места такого подхода. Так, четырёхъядерные и недавно вышедшие шестиядерные представители микроархитектуры Core просто собирались из нескольких двухъядерных кристаллов, что приводило к затруднению взаимодействия между ними. Обмен данными между разрозненными ядрами организовывался через системную память, что порой вызывало большие задержки, обусловленные ограниченной пропускной способностью процессорной шины. Ещё одно узкое место возникало в многопроцессорных системах. Хотя Intel уже решил проблему с разделением системной шины, выпустив чипсеты, предлагающие собственную шину каждому процессору, производительность часто ограничивалась недостаточно высокой пропускной способностью шины памяти. Эту проблему, например, можно было наблюдать даже в ориентированной на энтузиастов платформе Skulltrail, не говоря уже о высокопроизводительных рабочих станциях и серверах. Иными словами, дальнейшее увеличение многоядерности и многопроцессорности, выбранное основным вектором увеличения производительности современных систем, рано или поздно должны были завести Intel в тупик, даже несмотря на то, что сама по себе современная микроархитектура Core и представляется очень удачной. Именно поэтому Intel и стремится к скорейшему переходу на Nehalem – микроархитектуру, которая в первую очередь решает описанные структурные проблемы. Ведь ключевыми особенностями Nehalem, бросающимся на вид при первом знакомстве, стали интегрированный в процессор контроллер памяти и новая шина с топологией точка-точка Quick Path Interconnects (QPI), позволяющая не только связывать процессор с чипсетом, но и несколько процессоров между собой напрямик. Все эти нововведения перекликаются со строением процессоров AMD, и это действительно так: о перспективности встраивания контроллера памяти в процессор и связывания процессоров между собой в многопроцессорных системах AMD догадалась несколько лет назад. Однако в роли догоняющего Intel выступает только в плане архитектурных улучшений: по удельной производительности процессоров она лидирует с момента выхода микроархитектуры Core. Вторым важным нововведением в Nehalem стал модульный дизайн процессора. Фактически, микроархитектура сама по себе включает лишь несколько «строительных блоков», из которых на этапе конечного проектирования и производства может быть собран итоговый процессор.
Этот набор строительных блоков включает в себя процессорное ядро с L2 кэшем, L3 кэш, контроллер шины QPI, контроллер памяти, графическое ядро и так далее.
Рис. 2. Модульный дизайн процессора
Необходимые «кубики» будут собираться в едином полупроводниковом кристалле и преподноситься в качестве решения для того или иного рыночного сегмента. Например, процессор Bloomfield, с которым мы встретимся в ближайшее время, включает в себя четыре ядра, L3 кэш, контроллер памяти и один контроллер шины QPI.
Рис. 3. Модульная структура процессора Bloomfield
Серверные же процессоры с той же архитектурой, которые будут представлены в начале следующего года, будут включать до восьми ядер, до четырёх контроллеров QPI для объединения в многопроцессорные системы, L3 кэш и контроллер памяти. Бюджетные же модели семейства Nehalem, запланированные к выходу на вторую половину следующего года, будут располагать двумя ядрами, контроллером памяти, встроенным графическим ядром и контроллером шины DMI, необходимым для прямой связи с южным мостом. Это – далеко не все возможные варианты, мы привели именно их лишь в качестве иллюстрации чрезвычайной гибкости строения Nehalem. Новые принципы дизайна платформ и процессоров – существенное, но не единственное нововведение, приходящее с внедрением новой микроархитектуры Intel. Многие изменения заложены и в главной составной части процессора – непосредственно в вычислительном ядре. Несмотря на то, что ядра процессоров Nehalem с точки зрения пользователя можно рассматривать лишь как улучшенный вариант микроархитектуры Core, в них реализовано много новых технологий и усовершенствований. Благодаря им процессоры Nehalem могут похвастать и увеличившейся «чистой» производительностью. Среди важных нововведений необходимо отметить появление технологии SMT (Simultaneous Multi-Threading) – аналога памятной технологии Hyper-Threading, позволяющей одновременно исполнять два вычислительных потока на одном ядре; добавление поддержки новых команд SSE4.2; повышение результативности механизма предсказания переходов; увеличение размера внутренних буферов; улучшение эффективности и скорости работы подсистемы кэш-памяти. Подводя итог сказанному, обобщим основные отличительные черты процессоров, принадлежащих к поколению Nehalem:
Два, четыре или восемь ядер;
Усовершенствованные по сравнению с Core вычислительные ядра;
Технология SMT, позволяющая исполнять одновременно два вычислительных потока на одном ядре;
Три уровня кэш-памяти: L1 кэш размером 64 кбайта на каждое ядро, L2 кэш размером 256 кбайт на каждое ядро, общий разделяемый L3 кэш размером до 24 Мбайт;
Интегрированный контроллер памяти с поддержкой нескольких каналов DDR3 SDRAM;
Монолитная конструкция – процессор состоит из одного полупроводникового кристалла;
Технологический процесс с нормами производства 45 нм;
Возможность интегрирования в процессор графического ядра;
Новая шина QPI с топологией точка-точка для связи процессора с чипсетом и процессоров между собой;
Модульная структура.
Теперь, после краткого знакомства с общей концепцией новой микроархитектуры, давайте уделим больше внимания особенностям отдельных узлов процессоров, её использующих.