Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Доп.материал1 к лекция 5.doc
Скачиваний:
0
Добавлен:
23.11.2019
Размер:
373.76 Кб
Скачать

3. Процессор Intel Pentium 4 (Willamette).

В ноябре 2000 г. компания Intel приступила к производству 32-раз­рядного процессора седьмого поколения Pentium 4 с ядром Willamette. Разработку пришлось фор­сировать в связи с началом поставок в августе 1999 года процессора седьмого поколения Athlon фирмы AMD. Отставание во внедрении но­вой архитектуры более чем на год в истории Intel случилось впервые.

Процессор Pentium 4 с ядром Willamette содержал около 42 миллионов транзис­торов, что в сочетании с высокими рабочими частотами подразумевало большую тепловую мощность (до 75 Вт). Предусмотрен блок управления терморежимом процес­сора. В случае превышения заданного критического значения темпе­ратуры (например, для Pentium 4 с ядром Willamette и частотой 2 ГГц71 градус), происходило снижение рабочей частоты вплоть до останова процессора с выдачей предупреждения пользователю.

В архитектуре Pentium 4 видно влияние техно­логического подхода к проектированию процессоров. Сред­нее число выполняемых за такт операций не только не возросло, но даже упало по сравнению с процессором предыдущего поколения Pentium III. В итоге при равных рабочих частотах Pentium 4 проигрывал в производительности своему предшественнику.

Основой процессоров Pentium 4 стала архитектура NetBurst, в которой использовался ряд новых для того времени технологий.

4. Основные технологии Pentium 4.

  1. Новая системная шина на 100 МГц передавала по 4 пакета данных за такт (Quad Data Rate), эмулируя результирующую частоту 400 МГц с пиковой пропускной спо­собностью 3,2 Гбайт/с.

Это позволило увеличить скорость обмена данными между процессором и остальными устройствами, что дало впоследствии возможность использовать частоту системной шины в 400, 533 и 800 МГц.

  1. Гиперконвейерная обработка команд (Hyper Pipelined Technology) – увеличение длины конвейера вы­полнения инструкций - нивелировала отставание по удельной эффективности за счет повышения рабочих частот (См. выше). Очевидно, что чем длиннее конвейер, тем легче наращивать тактовую частоту, но тем меньше производительности получается на каждый тактовый импульс. Дело в том, что большее количество стадий конвейера распределяет меньше работы на отдель­ный такт, и тем самым этот такт выполняется быстрее. Pentium 3 имеет конвейер длиной 12 стадий, Athlon 10 ста­дий. Pentium 4 при длине конвейера 20 стадий имеет самое меньшее время выполнения такта, позволяющее достичь максимальной тактовой частоты, но и получает самые большие задержки для связанных друг с другом операций (второй операции придется ожидать 20 тактов, пока не завершится первая операция).

  2. Кэш трассировки инструкций (Execution Trace Cache) - применена кэш-память с отслеживанием выполнения команд. В него попадают уже декодированные инструкции, сгруппированные в соответствии с предсказанными трассами (переходами), что снижает задержки конвейера. Кэш данных уменьшен до 8 Кбайт с тем, чтобы обеспечить работу на высоких частотах.

  3. Механизм ускоренного исполнения команд (Rapid Execution Engine), который работает на удвоенной частоте ядра. Ускоренное исполнение подразумевает двукратное увеличение час­тоты работы арифметико-логических устройств (по сравнению с дру­гими элементами процессора, или, иначе говоря, базовой рабочей частотой). Например, при тактовой частоте ядра 2,53 ГГц блок быстрого исполнения команд (а это, в основном, арифметические и логические команды) работает на частоте 5,1 ГГц.

  4. Блок обра­ботки SIMD (Single instruction — multiple data) инструкций. 64-бит­ные инструкции рассчитаны на обработку чисел с плавающей запя­той, а 128-битные — на целочисленные данные. Таких блоков у Pentium 4 два: один для регистровых операций и другой — для арифметических. Набор SIMD-инструкций SSE2 включает 76 совершенно новых инструкций, опе­рирующих с широким диапазоном данных, и 68 расширенных для работы с целыми числами, обеспечивая динамическое исполнение команд, вычислений с плавающей запятой, обработку команд, используемых в мультимедийных приложениях.

  5. Кэш-память 2 уровня (L2) получила более совершенную систему передачи данных.

Кэш-память использует отдельную шину, независимую от системной (архитектура с двумя независимыми шинами - DIB), что увеличивает пропускную способность каналов передачи данных.

  1. Улучшенный блок суперскалярного внеоче­редного выполнения инструкций (Advanced Dynamic Execution) - процессор нарушает их есте­ственную последовательность с целью более плотной загрузки испол­нительных модулей.

Основной недостаток – наличие двух модулей обработки чисел с плавающей точкой (у Athlon - 3), что обеспечивало пиковую производительность в операциях с плаваю­щей точкой в два раза меньше, чем у Athlon, поскольку реальную вычислительную работу выполняет только один модуль, второй же выполняет вспомогательные функции. Поэтому Athlon с меньшей частотой работал на равных с Pentium 4.

В процессорах Pentium 4 с ядром Prescott, получивших название Pentium 4EE, для повышения производительности был увеличен размер кэш-памяти первого и второго уровня, введен новый набор инструкций SSE3, удлинен размер конвейера команд.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.