2.2. Микропроцессоры фирмы Intel
Большинство современных ПК типа IBM PC используют МП фирмы Intel типа CISC, характеристики наиболее распространенных приведены в таблице 4.2.
Таблица 4.2.
Характеристики наиболее распространенных МП Intel
Модель МП |
Разрядность, бит |
Тактовая частота, МГц |
Адресное простр-во, байт |
Размер внутр. КЭШа байт |
Число команд |
Число элемен. |
Техн. нормы мкм |
Год вып. | |
Данных |
Адреса | ||||||||
4004 |
4 |
4 |
4,77 |
212≈4 Кб |
|
45 |
2300 |
|
1971 |
8080 |
8 |
8 |
4,77 |
216≈64 К |
|
|
10000 |
|
1974 |
8086 |
16 |
20 |
4,77 и 8 |
220≈1 Мб |
|
134 |
70000 |
|
1980 |
8088 |
8, 16 |
20 |
4,77 и 8 |
220≈1 Мб |
|
134 |
70000 |
|
1981 |
80186 |
16 |
20 |
8 и 10 |
220≈1 Мб |
|
|
140000 |
|
1982 |
80286 |
16 |
24 |
6-20 |
224≈16 Мб (виртуальное 1 Гб) |
|
|
180000 |
|
1984 |
80386 |
32 |
32 |
12,5-40 |
232≈4 Гб (виртуальное 64 Гб) |
16 |
240 |
275000 |
|
1985 |
80486 |
32 |
32 |
20-100 |
232≈4 Гб (виртуальное 64 Гб) |
8-16 Кб |
240+6 |
1,2×106 |
0,8 |
1989 |
Pentium |
64 |
32 |
60-66 |
232≈4 Гб (виртуальное 64 Гб) |
8+8 Кб |
240 |
3,1×106 |
0,8 |
1993 |
75-120 |
3,3×106 |
0,6 |
1994 | ||||||
120-200 |
|
0,35 |
1995 | ||||||
Pentium Pro |
64 |
32 |
133-200 |
232≈4 Гб |
16+256-512 Кб |
240 |
5,5×106+ 15,5×106 |
0,35 |
1995 |
Pentium MMX |
64 |
32 |
166-233 |
232≈4 Гб (виртуальное 64 Гб) |
16+16-Кб |
240+57 |
4,5×106 |
0,35 |
1997 |
233-266 |
5,5×106 Tillamook |
0,25 | |||||||
Pentium II |
64 |
32 |
233-300 |
232≈4 Гб (виртуальное 64 Гб) |
16+16-Кб |
240+57 |
7,5×106 Klamath |
0,35 |
1997 |
266-450 |
7,5×106 Deschutes |
0,25 |
1998 | ||||||
Pentium III |
64 |
32 |
450-600 |
232≈4 Гб (виртуальное 64 Гб) |
16+16-Кб |
240+70 |
Katmai |
0,25 |
1999 |
500-1200 |
32+256 Кб |
9,5×106 Coppermine |
0,18 |
1999 | |||||
Pentium IV |
64 |
32 |
1300-1900 |
232≈4 Гб (виртуальное 64 Гб) |
16+256 Кб |
240+70+ 144 |
42×106 Willamette |
0,18- |
2000 |
2000-2533 |
|
0,13 |
2001 |
Примечание: Число элементов - это количество элементарных полупроводниковых элементов, размешенное в интегральной схеме МП. У Pentium Pro двухкристальный корпус: процессорный кристалл и кристалл КЭШ- памяти 2-го уровня.
Отметим некоторые характеристики современных МП:
начиная с МП 80286 предусматривается возможность работы в вычислительной сети;
начиная с МП 80286 микропроцессоры могут работать в двух режимах: реальном (Real mode) и защищенном (Protected mode).
В реальном режиме имитируется (эмулируется) однозадачная работа МП 8086. В защищенном режиме возможна многозадачная работа с непосредственным доступом к расширенной памяти(>1Мб) и с защитой памяти, отведенной задачам, от посторонних обращений. Многозадачность (многопрограммность) – это способ организации работы ЭВМ, когда в её памяти одновременно содержатся программы и данные для выполнения нескольких задач.
Начиная с МП 80386, обеспечивается поддержка режима виртуальных машин (Virtual mode, Enhanced mode, virtual - кажущийся, воображаемый), т.е. такого режима многозадачной работы, при котором в одном МП моделируется как бы несколько компьютеров, работающих параллельно и имеющих разные операционные системы (у 80386 до 256 МП 8086);
начиная с МП 80386 микропроцессоры имеют встроенную сверхбыструю КЭШ-память для буферизации часто используемых команд и данных (вначале 16 байт), что сокращает число обращений к внешней памяти;
начиная 80486DX2, микропроцессоры могут работать с умножением тактовой частоты. Например, у МП 80486DX2 внутренняя частота в 2 раза, а у МП 80486DX4 - в 4 раза выше тактовой. С увеличенной частотой работают только внутренние схемы МП, все внешние по отношению к МП схемы, в том числе расположенные и на системной плате, работают с обычной частотой тактового генератора;
начиная с МП 80486, используется конвейерное выполнение команд.
Под конвейером понимается такой метод обработки команд, когда исполнение команды разбивается на несколько ступеней (stages) и каждой ступени соответствует свой операционный блок в аппаратно логической структуре процессора, специализированный на выполнении строго определенной части команды. Например, у 80486, как и у Pentium конвейер состоит из 5 ступеней, а у Pentium IV – из 20. При этом когда i-тый блок выполняет i–ую ступень j–ой команды, (i-1)-ый блок выполняет (i-1)–ую ступень (j+1)–ой команды, а (i+1)–ый блок выполняет (i+1)–ую ступень (j-1)–ой команды. В результате образуется своего рода конвейер выполнения команд, что увеличивает эффективное быстродействие ПК в 2-3 раза.
Начиная с Pentium, процессоры являются суперскалярными устройствами, которые могут выполнять на своих нескольких (вначале двух) конвейерах несколько команд одновременно (параллельно) т.е. производить параллельные вычисления (в отличие от ранних скалярных моделей процессоров, которые могли в каждый момент времени выполнять только одну команду).
При этом на разных конвейерах осуществляется одновременное выполнение разных ступеней (тактов) последовательных команд при непосредственной передаче результатов с одного конвейера в другой. Для распределения потока команд по узлам обработки требуется существенное усложнение УУ. На данный момент самые передовые процессоры имеют 9 конвейеров (Atlon K7), при этом управляющая логика занимает слишком много места на кристалле.
Однако практически из-за сложности задачи распределения потока последовательных команд на параллельные конвейеры, процессор, теоретически выполняющий 4 простейшие команды одновременно, реально в среднем выполняет менее двух.
Начиная с Pentium появляется предсказание переходов. Для этого в МП имеется буфер адресов перехода (Branch Target Buffer, BTB), в который в соответствие с предсказанием направления ветвления программы заранее считываются команды из ячеек памяти с соответствующими адресами.
Поясним это. Согласно статистике переходы (команды условной и безусловной передачи управления) встречаются в среднем через каждые 6 команд. Условные переходы снижают общую производительность процессора, так как в ожидании этого перехода конвейер работает в холостую. Путем применения специальных алгоритмов предсказания переходов удается с той или иной точностью предсказать следующий переход, согласно которому и ведутся дальнейшие вычисления, чтобы конвейер не простаивал, а потом, после осуществления перехода, выдаются уже готовые (или не совсем готовые, но уже прошедшие некоторый путь по конвейеру результаты). При этом за счет оптимизации загрузки вычислительных конвейеров производительность работы процессора значительно повышается.
Микропроцессоры 80586 (Р5) более известны по их товарной марке Pentium имеют пятиступенную двух конвейерную структуру; специализированные конвейерные аппаратные блоки сложения, умножения и деления, значительно ускоряющие выполнение операций с плавающей запятой; встроенную КЭШ-память отдельно для команд, отдельно для данных. Pentium 2-го поколения работают с умножением тактовой частоты 66 МГц. По эффективному быстродействию они уже приблизились к RISC МП, выполняющим каждую команду как бы за один такт. Pentium имеют 32-разрядную адресную шину и 64-разрядную шину данных. Обмен данными с памятью может выполняться со скоростью 528 Мбайт/с.
Начиная с Pentium Pro, поддерживается многопроцессорная конфигурация (у Pentium Pro до 4-ёх, у МП Pentium II - 2, а в серверной версии Pentium III Xeon до 8-ми).
В феврале 1995 г. прошли презентацию и выпущены МП 80686 (Р6), торговая марка Pentium Pro. Благодаря новым схемотехническим решениям они обеспечивают для ПК более высокую производительность. Часть этих новшеств может быть объединена понятием динамическое исполнение (dynamic execution), что в первую очередь означает наличие 14-ступенной 3-ёх конвейерной структуры, предсказания ветвлений программы при условных передачах управления (branch prediction) и исполнение команд по предполагаемому пути ветвления (speculative execution). В процессоре Pentium Pro вероятность правильного предсказания 90% против 80% у МП Pentium.
КЭШ-память емкостью 256-512 Кбайт - обязательный атрибут высокопроизводительных систем. Однако у Pentium встроенная КЭШ-память (Internal Cache, L1 Cache, КЭШ память 1-го уровня) имеет небольшую емкость (16 Кбайт), а основная ее часть находится вне процессора на материнской плате (External Cache, L2 Cache, КЭШ память 2-го уровня). Поэтому обмен данными с ней происходит не на внутренней частоте МП, а на частоте тактового генератора, которая обычно в 2-3 раза ниже, что снижает общее быстродействие компьютера. В МП Pentium Pro вся КЭШ-память емкостью 256-512 Кбайт (как 1-го так и 2-го уровня) находится в самом микропроцессоре.
Необходимо отметить также технологию MMX (MultiMedia Extension – мультимедийные расширения). Появившиеся в январе 1997 г. процессоры Pentium MMX имеют 6-ступенчатый конвейер и 57 дополнительных команд, ускоряющих обработку мультимедийных данных. Данные мультимедиа, разрядность которых равна 8, упаковываются в одно 64-разрядное слово и над ним производится некоторое общее действие. Эта методика называется SIMD (Single Instruction – Multiple Data – одна команда с многочисленными данными) и ориентирована на алгоритмы и типы данных, характерные для мультимедиа-приложений.
МП Pentium II сочетает в своей архитектуре технологии Pentium Pro и поддержку новых инструкций MMX. КЭШ-память 2-го уровня имеет размер 512 Кбайт, и хотя не интегрирована в ядро МП, как у Pentium Pro, но расположена на картридже процессора, имеет отдельную (выделенную) 64-разрядную шину и работает на половине частоты процессора, что обеспечило существенное увеличение производительности. Тактовая частота также увеличилась до 100 МГц. Впервые осуществлена поддержка слота AGP (Accelerated Graphics Port). Pentium II Xeon может иметь КЭШ-память 2-го уровня объемом до 2 Мб, работающую на полной частоте процессора (500 МГц), а также, благодаря архитектуре Extended Server Memory, позволяет адресоваться к памяти объемом > 64Гб.
МП Pentium III имел вначале такие же принципы организации КЭШ-памяти 2-го уровня, но более современную технологию SSE – Streaming SIMD Extension (70 новых команд плюс дополнительный конвейер для их обработки). 70 инструкций SSE оперируют со специальными 128-битными регистрами. Каждый из них хранит 4 вещественных числа одинарной точности. Выполняя операцию над двумя регистрами, команда SSE оперирует 4-мя парами чисел, т.е. выполняет 4 обычные операции одновременно. Таким образом, в МП Pentium III появился блок подобный MMX, но оперирующий с вещественными числами. Это решение улучшает производительность процессора при работе с трехмерными графикой и видеоизображениями, использующих вычисления с плавающей точкой. Например, при обработке видеоформата MPEG-1 превосходство над процессором Pentium II составляет 50%.
Усовершенствованный Pentium III на ядре Coppermine имеет КЭШ-памяти 2-го уровня меньшего объема (256 Кбайт), но интегрированную в процессор и работающую на его частоте. Кроме того, применения 256-разрядная шины КЭШ-процессор. Все это увеличило скорость передачу данных по этой шине для процессора с частотой 1 ГГц до 16 Гбайт/с.
Тактовая частота также увеличилась до 133 МГц. Существует также серверная версия Pentium III Xeon.
В ноябре 2000 г. прошла презентация МП Pentium IV, c микро-архитектурой NetBurst. В ней используется новая гиперконвейерная технология исполнения команд (Hyper Pipeline) с числом ступеней конвейера – 20, новая технология динамического исполнения команд (Advanced Dynamic Execution), под которой понимается улучшенная версия механизма суперскалярного внеочередного выполнения инструкций, когда процессор переставляет команды, нарушая их естественную последовательность, с целью более плотной загрузки конвейеров. Улучшенные схемы предсказания переходов повысили точность предсказания до 95%.
Блок целочисленных операций (Arithmetic Logic Units, ALU) работает на удвоенной частоте процессора (на самом деле частота та же, просто этот блок умеет выполнять вычисления за полтакта), а так как этих блоков два, то за один такт процессор может выполнять до 4-ех операций с числами в формате с фиксированной точкой.
Pentium IV имеет также новый набор SIMD команд SSE2, который дополнен 144 новыми командами, в их числе 128-разрядные команды для вычислений с числами с фиксированной и плавающей точкой.
Помимо КЭШ-памяти данных 1-го уровня (8 Кб) Pentium IV имеет КЭШ-память команд 1-го уровня (8 Кб) с отслеживанием выполнения (Execution Trace Cache), которая хранит до 12000 декодированных микрокоманд в порядке их выполнения. Это увеличивает быстродействие за счет устранения дешифратора из цикла выполнения машинных команд. КЭШ-память 2-го уровня с улучшенной передачей данных (Advanced Transfer Cache) объемом 256 Кб, обеспечивает скорость передачи данных для процессора с частотой 1,5 ГГц 48 Гбайт/с.
Применена новая системная шина, работающая с тактовой частотой 100 МГц, но за счет того, что за такт передается 4 пакета данных, результирующая частота составляет 400 МГц. Скорость передачи данных между процессором и памятью достигает 3,2 Гбайт/с.