 
        
        - •Курсовая работа
- •Москва – 2014 Оглавление
- •Глава 1. Многоядерные процессоры intel
- •§1.1. Hyper-Threading Technology
- •§1.2. Intel Pentium d
- •§1.3. Intel Core Duo (Yonah)
- •§1.4. Intel Core 2 Duo (Conroe)
- •§1.5. Intel core I на микроархитектуре Nehalem.
- •§1.6. Intel core I на микроархитектуре Sandy Bridge
- •§1.7. Intel core I на микроархитектуре Ivy Bridge
- •§1.8. Intel core I на микроархитектуре Haswell
- •Глава 2. Многоядерные процессоры amd
- •§2.1. Athlon 64 x2
- •§2.2. Amd Phenom
- •§2.3. Amd phenom II
- •§2.4. Amd Bulldozer
- •§2.5. Процессоры amd на микроархитектуре Piledriver
§2.3. Amd phenom II
В рамках выставки CES 2009 в Лас-Вегасе компания AMD официально анонсировала новую программно-аппаратную платформу для настольных ПК - AMD Dragon, и вместе с этим были представлены первые процессоры для настольных ПК нового поколения - AMD Phenom II X4. В отличие от предыдущего поколения 65-нм процессоров AMD Phenom (K10) под кодовым названием Agena, реализованного на базе общей микропроцессорной архитектуры Barcelona, новые процессоры AMD Phenom II X4 (Deneb) базируются на новом поколении микропроцессорной архитектуры Shanghai с расширениями STARS.
Нововведения:
-Техпроцесс с применением 45-нм норм и технологии "кремний-на-изоляторе" (Silicon on Insulator, SOI). В сравнении с предыдущим поколением процессоров AMD, выполненным с соблюдением норм 65-нм техпроцесса с SOI, новые процессоры изготавливаются с применением 45-нм техпроцесса с SOI, с использованием иммерсионной (с погружением в жидкость) литографии. Благодаря применению более прецизионного техпроцесса и ряда схемотехнических инноваций удалось снизить термопакет процессоров при более высоких тактовых частотах, снизить энергопотребление процессора в ждущем режиме примерно на 35%. Благодаря применению нового 45-нм техпроцесса также удалось улучшить геометрические показатели процессоров. Так, теперь 758 млн. транзисторов, из которых состоят процессоры семейства AMD Phenom II X4, размещаются на площади кристалла всего 258 мм².
-Увеличение кэша L3 до 6 Мб (Предыдущее поколение - 2 Мб). В новых процессорах кэш L2 составляет 512 Кб х 4 для 4-ядерных и 512 Кб х 3 для 3-ядерных процессоров; кэш L1 (данные + инструкции) - 64 Кб + 64 Кб на каждое ядро. Таким образом, получается комбинация кэшей L1/L2 с увеличенной втрое распределённой кэш-памятью L3. Такая организация кэш-памяти позволяет значительно уменьшить латентность при доступе к кэш-памяти L2 при сохранении быстрого доступа к кэшу L3. Нововведение должно сказаться на общем росте производительности процессора за счёт заметном улучшенной работы с многопоточными и многозадачными приложениями, поскольку каждое ядро имеет собственный кэш L2 и может обращаться к большому распределённому кэшу L3.
-Технология Cool'n'Quiet 3.0 в сочетании с энергоэффективным 45-нм дизайном процессоров AMD Phenom II X4 предоставляет значительные возможности экономии расхода энергии. Согласно официальным заявлениям AMD, новая версия технологии энергосбережения на 50% эффективнее нежели предыдущая версия Cool'n'Quiet 2.0.
 
§2.4. Amd Bulldozer
Bulldozer — кодовое название новой процессорной архитектуры процессоров AMD64 (в рамках системы команд x86) от компании AMD, поколения AMD K11, изготавливаемых по 32-нм технологии и предназначенных для серверов и высокопроизводительных ПК.
Процессоры Bulldozer впервые будут поддерживать новые инструкции x86 (SSE4.1, SSE4.2, CVT16, AVX и XOP, в том числе 4-операндный модуль FMAC). Bulldozer содержат до 8 ядер для настольного сегмента, до 16 ядер — для серверного, и обладают совместимостью с модульной процессорной архитектурой M-SPACE. Введена поддержка новой версии технологии AMD Direct Connect и четырёх каналов Hyper-Transport 3.1 на каждый процессор. Возможность работы с памятью DDR3 и технологией расширения памяти AMD G3MX позволит увеличить пропускную способность процессора. Также улучшено управление питанием. Одной из ключевых особенностей процессоров на базе микроархитектуры Bulldozer стал переход на 32-нм литографический процесс, который на протяжении почти двух лет весьма успешно используется основным конкурентом — компанией Intel. Кроме потенциального уменьшения энергопотребления и улучшения разгонного потенциала, этот факт положительно отразился на стоимости производства полупроводниковых кристаллов.
 
Для хранения инструкций каждый вычислительный модуль располагает отдельным кэшем L1 объемом 64 Кбайт, а промежуточные данные накапливаются в кэш-памяти второго уровня, размеры которого составляют впечатляющие 2 Мбайт. Общий для всех четырех вычислительных блоков массив кэша 3-го уровня имеет объем 8 Мбайт и обладает ассоциативностью в 64 линии на каждый модуль. Благодаря применению эксклюзивной организации кэшей 2-го и 3-го уровней можно говорить об их суммарном объем в 16 Мбайт. Не удивительно, что кристалл Bulldozer получился таким сложным, львиная доля транзисторного бюджета отведена для организации внутренней памяти процессора. Рабочая частота кэш-памяти L3 может составлять 2000 МГц или 2200 МГц в зависимости от модели процессора. Помимо архитектуры изменения претерпели и механизмы управления энергопотребления. Несмотря на большее количество транзисторов и высокие тактовые частоты, даже старшие восьмиядерные AMD FX имеют тепловой пакет, не превышающий 125 Вт. Определенную роль в этом сыграл и 32-нм технологический процесс, благодаря которому штатное напряжение питания не превышает 1,4 В, но основная заслуга все таки принадлежит продвинутым механизмам регулировки тактовых частот и питающих напряжений. Первое поколение данной концепции было реализовано в Phenom II X6, где в случае вычислительной нагрузки не более трех потоков, гораздо более гибкий поход к управлению ключевыми параметрами быстродействия. Так, благодаря частоты трех активных ядер могли повышаться на 400 МГц. Процессоры AMD FX предлагают применению силовых вентильных транзисторов диспетчер энергосбережения процессора способен отключать целые функциональные блоки. При отсутствии нагрузки вычислительный модуль вместе с массивом кэш-памяти 2-го уровня может полностью отключаться, высвобождая часть бюджета TDP. В то же время, тактовая частота и напряжение активных вычислительных модулей может повышаться, причем прирост частоты в режиме Max Turbo достигает 900 МГц.
Однако процессоры AMD FX с микроархитектурой Bulldozer пришлись не по душе не большинству потребителей. Покупатели предпочитают предложения конкурента, так как в подавляющем большинстве случаев процессоры семейств Core i5 и Core i7 не только заметно быстрее, но и существенно экономичнее. Конечно, примеры приложений, где применение Bulldozer может быть оправданно, существуют, но это по большей части сугубо узкоспециализированные задачи. В общеупотребительных же средах — и в первую очередь в играх — AMD FX выглядят весьма бледно.
Причина такого положения дел кроется в особенностях микроархитектуры Bulldozer. Основная идея, заложенная в дизайне этих процессоров, не так уж и плоха. Упрощение отдельных вычислительных ядер в пользу наращивания их количества и увеличения тактовой частоты вполне имеет право на жизнь, ведь с каждым годом всё больше разработчиков программного обеспечения увереннее переходят на многопоточные алгоритмы. Однако первейший недостаток Bulldozer состоит в том, что его ядра оказались уж слишком простыми и низкопроизводительными, а создание большого количества равноправных вычислительных потоков возможно при решении далеко не каждой реальной задачи. Есть и другая проблема. Ядра в процессорах с микроархитектурой Bulldozer попарно скомпонованы в модули-сборки, разделяющие некоторые ключевые блоки. В результате загрузка работой более половины вычислительных ядер приводит к падению удельной производительности в пересчёте на одно ядро. По идее, все эти слабые места могли бы быть скомпенсированы высокой тактовой частотой, однако на пути такого естественного решения встали используемый AMD технологический процесс с 32-нм нормами и недостаточно отработанный дизайн полупроводникового кристалла. Поэтому-то и вышло, что блеснуть производительностью Bulldozer может исключительно за счёт своего превосходства в количестве ядер, то есть в тех немногих случаях, когда приложение способно создать восемь полностью равноправных вычислительных потоков. Однако даже в такой идеальной для микроархитектуры AMD ситуации скорость восьмиядерных Bulldozer не дотягивает до уровня быстродействия четырёхъядерных процессоров Core i7, которые тоже способны исполнять восемь потоков одновременно за счёт технологии Hyper-Threading.
