Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Электроника и микропроцессорная техника.doc
Скачиваний:
58
Добавлен:
21.11.2018
Размер:
1.24 Mб
Скачать

1.5. Микропроцессоры фирмы amd

Микропроцессор К5.

В 1996 г. фирмой AMD был

предложен к реализации первый скалярный процессор на основе одного исполнительного конвейера К5 (5´86), использующий 64 - разрядную шину данных (ШД) и работающий на частоте 100 МГц. МП имеет практически самое высокое быстродействие при обработке команд целочисленной арифметики. Однако из-за несовершенного конструктивно-технологического исполнения арифметического сопроцессора обработка команд с плавающей точкой, имеющих место во всех программах трехмерной графики, операциях с многоканальным звуком и т.д., он по производительности значительно уступает аналогичным микропроцессорам Intel. Вторым недостатком МП было то, что используемая в нем технология не дает возможности увеличения тактовой частоты, что сводило практически на нет все попытки дальнейшего совершенствования этой модели МП.

После этого AMD приобрела фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6.

Микропроцессор К6-2

В 1998 г. фирма AMD приступила к

выпуску процессораК6-2, в котором использованы ряд технических новшеств (разделены блоки диспетчеризации потока команд и данных, использовано преобразование 80 ´ 86 команд в набор RISC - подобных внутренних микроопераций, добавлены к стандартному набору команд инструкции мультимедийной (ММХ) архитектуры и т.д.). Процессоры выпускаются на тактовые частоты 300, ..., 500 МГц, выполнены на кристалле площадью 81 мм2 по 0,25 – микронной технологии, имеют 9,3 млн. транзисторов и рассчитаны на работу с 100 МГц шиной. Процессор имеет встроенные кэш-памяти L1 и L2, причем кэш-память L1 имеет объем 64 Кб (по 32 Кб на кэш-команд и кэш-данных), а кэш-память L2 встроена в процессор, имеет объем 256 Кб и работает на частоте процессора.

Напряжение питания ядра процессора - 2,2 В.

Для повышения производительность обработки команд с плавающей точкой в К6-2 AMD предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!, выполнение которых возлагалось на основной процессор. Для этого к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность.

Использование указанной технологии позволяло переложить задачу обработки команд с плавающей точкой на основной процессор, имеющего большее быстродействие, чем быстродействие арифметического сопроцессора. Однако высокая производительность этого МП проявлялась только в том случае, когда обрабатываемые программы выполнялись с учетом технологии 3DNow!.

Микропроцессор К6-3

Для повышения производительно-

сти с использованием новой технологии 3Dnow! AMD добавила интегрированный в ядро кэш-память второго уровня L2, работающую на частоте процессора. Новый процессор К6-3 (разъем Socket 7) получил кодовое название Sharptooth, выполнен по 0,25 мкм технологии и имеет 21,3 млн. транзисторов. Он работает на частотах 350,..., 475 МГц, что позволяет обеспечить работу системной шины на частоте до 100 МГц. Кэш-памяти L1 имеет объем 64 Кб (по 32 Кб на кэш-команд и кэш-данных), а кэш-память L2 - 256 Кб. Кроме того, в системе предусматривается использование кэш-памяти третьего уровня L3, позволяющая несколько увеличить производительность процессора. Напряжение питания процессора 2,3-2,5 В.

Система команд процессора дополнена 21 SIMD-командами 3Dnow! для обработки чисел с плавающей точкой. Арифметический сопроцессор имеет два конвейера, оперирующими с двумя парами вещественных чисел одинарной точности.

Ядро процессора отличается от предшествующего наличием функции пакетной записи в память. Суть такой записи заключается в том, что данные по шине передаются по мере их накопления 8-ми байтными пакетами.

Микропроцессор К7 “Athlon”

C 1999 г. АMD начала выпуск

0,25 мкм (а позже и 0,18 мкм) RISC - процессора К7, который имеет площадь кристалла менее 100 кв. мм., рассчитан на работу при тактовых частотах 500, ..., 650 МГц и имеет наибольшую производительность при обработке команд с плавающей точкой. Процессор содержит 22 млн. транзисторов, поддерживает системную шину Alpha EV6, кэш-память L1 имеет объем 128 Кб (по 64 Кб на кэш-команд и кэш-данных), а кэш-память L2 - от 512 Кб до 8 Мб, которая может работать либо на полной тактовой частоте процессора, либо на половинной, либо на одной третьей частоте.

Набор SIMD-инструкций расширен до 45 команд. Напряжение питания ядра процессора - 1,6 В.

Для установки процессора используется специальный разъем Slot A, который выглядит также как и Slot 1, но шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов - Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть.

Отличительной особенностью процессора является системная шина EV6, которая хотя и работает на частоте 100 МГц, но передача данных по ней, в отличие от GTL+ фирмы Intel, ведется на обоих фронтах сигнала. Поэтому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ESS (под проверку контрольной суммы), то скорость передачи данных составляет:

V д = 64 бита  200 МГц = 1,6 Гбайт/с.

Заметим, что пропускная способность GTL+, работающей на 100 МГц частоте, в два раза меньше и составляет около 800 Мбайт/с. Таким образом, EV6 более перспективна. При этом планируется, что частота EV6 должна достигнуть значения 133 (266), а затем и 200 (400) МГц.

Еще одна интересная особенность EV6 заключается в поддержке многопроцессорных систем. В отличие от GTL+, EV6 обеспечивает соединение точка-точка между процессорами, что позволяет выделить всю пропускную способность шины для каждого процессора. Теоретически таким образом может подключаться до 14 процессоров, что и определяет перспективность EV6 при использовании в многопроцессорных системах.

Особенности работы процессора заключаются в следующем.

Перед началом работы над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в буфере (Instruction Control Unit), который рассчитан на 72 инструкции.

Для эффективной работы с программами таблица предсказания переходов имеет размер 2048 ячеек, в которых сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этому Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев.

Блок целочисленных вычислений имеет три конвейера для исполнения целочисленных команд (Integer Execution Unit). Это позволяет процессору исполнять три целочисленные инструкции одновременно. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается, что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново. Потому в Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму.

Блок FPU, предназначенный для обработки вещественных чисел, имеет существенные отличия от предыдущих процессоров AMD, которые в K6, K6-2 и K6-3 были неконвейеризированными. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за малое число тактов, но общая производительность была низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей.

В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий и объединяет в себе три блока: один для выполнения простых операций типа сложения, второй - для сложных операций типа умножения и третий - для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкции.

Некоторые изменения произошли с выполнением MMX-операций. В процессоре добавлено несколько инструкций по нахождению среднего, максимума и минимума и пересылкам данных. Если обратить внимание на архитектурные особенности, то в Athlon имеется по два блока MMX, потому в нем может выполняться одновременно пара MMX - инструкций.

Блок 3DNow! в Athlon подвергся также сильным изменениям. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, набор команд расширен до 45 команд. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также при работе в глобальной сети. Кроме этого, были добавлены и инструкции для работы с данными, находящимися в кэш-памяти.