- •Amd и Intel – история борьбы за лидерство в XXI веке.
- •1. Технология производства процессоров.
- •2. Amd и Intel –два различных подхода к проектированию архитектуры процессоров.
- •3. Процессор Intel Pentium 4 (Willamette).
- •4. Основные технологии Pentium 4.
- •5. Intel Pentium 4 (Northwood).
- •6. Pentium 4 и технология Hyper Threading.
- •7. Процессор Pentium 4 Extreme Edition.
- •8. Решения Intel для ноутбуков.
- •9. Intel Itanium.
- •10. Intel Хеоn.
- •11. Основные технологии корпорации amd.
- •12. Amd Athlon хр
- •13. Amd Athlon mp.
- •15. Amd Opteron (SledgeHammer) и amd Athlon 64 (ClawHammer)
- •16. Понятие многоядерности.
- •Совершенствование собственно многоядерных процессоров
- •Разработка нового поколения по для них
- •17. Двухъядерные процессоры.
- •L2 l1 l2 Core 1 Core 2
- •L2 l2 l1 l1 Core 1 Core 2
- •18. Последующие разработки Intel.
- •19. Двухядерные процессоры Opteron и Athlon 64.
- •20. Двухъядерный процессор Athlon 64 х2.
- •21. Последующие разработки amd
3. Процессор Intel Pentium 4 (Willamette).
В ноябре 2000 г. компания Intel приступила к производству 32-разрядного процессора седьмого поколения Pentium 4 с ядром Willamette. Разработку пришлось форсировать в связи с началом поставок в августе 1999 года процессора седьмого поколения Athlon фирмы AMD. Отставание во внедрении новой архитектуры более чем на год в истории Intel случилось впервые.
Процессор Pentium 4 с ядром Willamette содержал около 42 миллионов транзисторов, что в сочетании с высокими рабочими частотами подразумевало большую тепловую мощность (до 75 Вт). Предусмотрен блок управления терморежимом процессора. В случае превышения заданного критического значения температуры (например, для Pentium 4 с ядром Willamette и частотой 2 ГГц — 71 градус), происходило снижение рабочей частоты вплоть до останова процессора с выдачей предупреждения пользователю.
В архитектуре Pentium 4 видно влияние технологического подхода к проектированию процессоров. Среднее число выполняемых за такт операций не только не возросло, но даже упало по сравнению с процессором предыдущего поколения Pentium III. В итоге при равных рабочих частотах Pentium 4 проигрывал в производительности своему предшественнику.
Основой процессоров Pentium 4 стала архитектура NetBurst, в которой использовался ряд новых для того времени технологий.
4. Основные технологии Pentium 4.
Новая системная шина на 100 МГц передавала по 4 пакета данных за такт (Quad Data Rate), эмулируя результирующую частоту 400 МГц с пиковой пропускной способностью 3,2 Гбайт/с.
Это позволило увеличить скорость обмена данными между процессором и остальными устройствами, что дало впоследствии возможность использовать частоту системной шины в 400, 533 и 800 МГц.
Гиперконвейерная обработка команд (Hyper Pipelined Technology) – увеличение длины конвейера выполнения инструкций - нивелировала отставание по удельной эффективности за счет повышения рабочих частот (См. выше). Очевидно, что чем длиннее конвейер, тем легче наращивать тактовую частоту, но тем меньше производительности получается на каждый тактовый импульс. Дело в том, что большее количество стадий конвейера распределяет меньше работы на отдельный такт, и тем самым этот такт выполняется быстрее. Pentium 3 имеет конвейер длиной 12 стадий, Athlon — 10 стадий. Pentium 4 при длине конвейера 20 стадий имеет самое меньшее время выполнения такта, позволяющее достичь максимальной тактовой частоты, но и получает самые большие задержки для связанных друг с другом операций (второй операции придется ожидать 20 тактов, пока не завершится первая операция).
Кэш трассировки инструкций (Execution Trace Cache) - применена кэш-память с отслеживанием выполнения команд. В него попадают уже декодированные инструкции, сгруппированные в соответствии с предсказанными трассами (переходами), что снижает задержки конвейера. Кэш данных уменьшен до 8 Кбайт с тем, чтобы обеспечить работу на высоких частотах.
Механизм ускоренного исполнения команд (Rapid Execution Engine), который работает на удвоенной частоте ядра. Ускоренное исполнение подразумевает двукратное увеличение частоты работы арифметико-логических устройств (по сравнению с другими элементами процессора, или, иначе говоря, базовой рабочей частотой). Например, при тактовой частоте ядра 2,53 ГГц блок быстрого исполнения команд (а это, в основном, арифметические и логические команды) работает на частоте 5,1 ГГц.
Блок обработки SIMD (Single instruction — multiple data) инструкций. 64-битные инструкции рассчитаны на обработку чисел с плавающей запятой, а 128-битные — на целочисленные данные. Таких блоков у Pentium 4 два: один для регистровых операций и другой — для арифметических. Набор SIMD-инструкций SSE2 включает 76 совершенно новых инструкций, оперирующих с широким диапазоном данных, и 68 расширенных для работы с целыми числами, обеспечивая динамическое исполнение команд, вычислений с плавающей запятой, обработку команд, используемых в мультимедийных приложениях.
Кэш-память 2 уровня (L2) получила более совершенную систему передачи данных.
Кэш-память использует отдельную шину, независимую от системной (архитектура с двумя независимыми шинами - DIB), что увеличивает пропускную способность каналов передачи данных.
Улучшенный блок суперскалярного внеочередного выполнения инструкций (Advanced Dynamic Execution) - процессор нарушает их естественную последовательность с целью более плотной загрузки исполнительных модулей.
Основной недостаток – наличие двух модулей обработки чисел с плавающей точкой (у Athlon - 3), что обеспечивало пиковую производительность в операциях с плавающей точкой в два раза меньше, чем у Athlon, поскольку реальную вычислительную работу выполняет только один модуль, второй же выполняет вспомогательные функции. Поэтому Athlon с меньшей частотой работал на равных с Pentium 4.
В процессорах Pentium 4 с ядром Prescott, получивших название Pentium 4EE, для повышения производительности был увеличен размер кэш-памяти первого и второго уровня, введен новый набор инструкций SSE3, удлинен размер конвейера команд.
