
- •АнНоТация
- •Оглавление
- •Введение
- •Общие принципы микроархитектуры Nehalem
- •Усовершенствованное процессорное ядро
- •Tlb и кэш-память
- •Новые sse4.2 инструкции
- •Интегрированный контроллер памяти
- •Шина qpi
- •Управление питанием и Turbo-режим
- •Первые Nehalem – это Bloomfield
- •Заключение
- •Приложение. Оперативная памятьDdr 3 Изучаем новое поколение памяти ddr sdram, теоретически и практически
- •Ddr3: некоторые технические сведения
- •Литература
Новые sse4.2 инструкции
В новой
микроархитектуре Nehalem Intel продолжила
взятый ранее курс на увеличение числа
поддерживаемых SIMD инструкций. Пополненный
набор команд расширился за счёт семи
новых инструкций и получил название
SSE4.2 (обозначение SSE4.1 использовалось
для системы SIMD команд процессоров
Penryn). При этом Intel специально заостряет
внимание на том, что введённые в набор
SSE4.2 инструкции ориентированы не столько
на ускорение обработки потокового
медиа-контента, сколько на иные цели.
Именно поэтому новые, введённые в
Nehalem, инструкции получили также условное
обозначение ATA (Application Targeted
Accelerators).
Концепция ATA преподносится
так, что современные технологические
процессы позволяют задействовать часть
процессорных транзисторов не только
на универсальные функциональные блоки,
но и на специфические нужды, поднимая
быстродействие конкретных задач.
Так,
в соответствии с этой концепцией в
SSE4.2 добавлено пять инструкций,
предназначенных для ускорения
синтаксического анализа XML-файлов. Также
с помощью этих же инструкций возможно
увеличение скорости обработки строк и
текстов. Ещё две новые инструкции из
набора SSE4.2 нацелены на совершенно иные
приложения. Первая из них, CRC32, аккумулирует
контрольную сумму CRC32c, а вторая, POPCNT,
подсчитывает число ненулевых бит в
источнике. Эти команды также могут найти
широкое применение в различных прикладных
и сетевых приложениях.
Интегрированный контроллер памяти
Nehalem стала первой
интеловской микроархитектурой,
предполагающей интеграцию контроллера
памяти внутрь процессора. Казалось бы,
здесь инженеры Intel позаимствовали идею
своих коллег из AMD, которые встраивают
контроллер памяти внутрь процессоров
начиная с 2003 года. Однако это не совсем
так, поскольку первыми процессорами с
интегрированным контроллером памяти
должны были стать так и не вышедшие
Intel Timna, работа над которыми активно
велась в 1999 году. Кроме того, обвинения
в плагиате следует отмести и потому,
что разработанный Intel для Nehalem контроллер
памяти сильно отличается от контроллера,
эксплуатируемого в существующих
процессорах AMD. Подход Intel к проблеме
оказался куда более масштабным.
Главное
свойство контроллера памяти процессоров
семейства Nehalem – гибкость. Учитывая
модульный дизайн всего перспективного
семейства процессоров, которое может
содержать сильно различающиеся по
характеристикам и рыночному позиционированию
продукты, Intel предусмотрела возможность
не только включать или отключать
поддержку буферизированных модулей,
но и варьировать число каналов и скорость
памяти.
При этом первые процессоры с
микроархитектурой Nehalem, которые будут
выпущены в четырёхъядерном варианте,
получат трёхканальный контроллер памяти
с поддержкой DDR3 SDRAM. Таким образом,
настольные системы, построенные на
новых процессорах, смогут похвастать
непревзойдённой пропускной способностью
подсистемы памяти, которая в случае
использования трёх модулей DDR3-1067
достигнет 25,6 Гбайт/с.
Впрочем, основное
преимущество переноса контроллера DRAM
в процессор заключается не столько в
росте пропускной способности, сколько
в уменьшении латентности подсистемы
памяти. Несмотря на то, что Intel предлагает
использовать с новыми процессорами
DDR3 память, отличающуюся относительно
высокой латентностью, задержки при
обращении Nehalem к памяти будут в любом
случае ниже, чем в системах, основанных
на процессорах Core 2 и использующих DDR3
SDRAM (и, наверняка, DDR2 SDRAM).
Для подтверждения
этих слов хотелось бы привести данные,
полученные при измерении практических
параметров подсистемы памяти системы
на базе Nehalem в тестовой утилите Everest
4.60.
Таблица
2. Тестирование работы памяти
Собственно,
даже работая в одноканальном режиме,
контроллер памяти Nehalem способен показать
лучшую производительность, чем контроллер
памяти сегодняшних LGA775 платформ. Это
совершенно закономерный результат, так
как на пути между процессором и памятью
в системах нового поколения нет никаких
промежуточных устройств – в то время
как ранее за работу с памятью отвечал
северный мост чипсета, который вносил
собственные весьма существенные
задержки, вызванные необходимостью
синхронизации шин памяти и FSB.
Ещё
одно косвенное преимущество встроенного
в процессор памяти заключается в том,
что его функционирование теперь не
зависит ни от чипсета, ни от материнской
платы. В результате, Nehalem будет показывать
одинаковую скорость работы с памятью
при работе в платформах различных
разработчиков и производителей.