Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задания к практическим работам / _пример_оформления.doc
Скачиваний:
25
Добавлен:
20.06.2014
Размер:
291.33 Кб
Скачать

Новые sse4.2 инструкции

В новой микроархитектуре Nehalem Intel продолжила взятый ранее курс на увеличение числа поддерживаемых SIMD инструкций. Пополненный набор команд расширился за счёт семи новых инструкций и получил название SSE4.2 (обозначение SSE4.1 использовалось для системы SIMD команд процессоров Penryn). При этом Intel специально заостряет внимание на том, что введённые в набор SSE4.2 инструкции ориентированы не столько на ускорение обработки потокового медиа-контента, сколько на иные цели. Именно поэтому новые, введённые в Nehalem, инструкции получили также условное обозначение ATA (Application Targeted Accelerators). Концепция ATA преподносится так, что современные технологические процессы позволяют задействовать часть процессорных транзисторов не только на универсальные функциональные блоки, но и на специфические нужды, поднимая быстродействие конкретных задач. Так, в соответствии с этой концепцией в SSE4.2 добавлено пять инструкций, предназначенных для ускорения синтаксического анализа XML-файлов. Также с помощью этих же инструкций возможно увеличение скорости обработки строк и текстов. Ещё две новые инструкции из набора SSE4.2 нацелены на совершенно иные приложения. Первая из них, CRC32, аккумулирует контрольную сумму CRC32c, а вторая, POPCNT, подсчитывает число ненулевых бит в источнике. Эти команды также могут найти широкое применение в различных прикладных и сетевых приложениях.

Интегрированный контроллер памяти

Nehalem стала первой интеловской микроархитектурой, предполагающей интеграцию контроллера памяти внутрь процессора. Казалось бы, здесь инженеры Intel позаимствовали идею своих коллег из AMD, которые встраивают контроллер памяти внутрь процессоров начиная с 2003 года. Однако это не совсем так, поскольку первыми процессорами с интегрированным контроллером памяти должны были стать так и не вышедшие Intel Timna, работа над которыми активно велась в 1999 году. Кроме того, обвинения в плагиате следует отмести и потому, что разработанный Intel для Nehalem контроллер памяти сильно отличается от контроллера, эксплуатируемого в существующих процессорах AMD. Подход Intel к проблеме оказался куда более масштабным. Главное свойство контроллера памяти процессоров семейства Nehalem – гибкость. Учитывая модульный дизайн всего перспективного семейства процессоров, которое может содержать сильно различающиеся по характеристикам и рыночному позиционированию продукты, Intel предусмотрела возможность не только включать или отключать поддержку буферизированных модулей, но и варьировать число каналов и скорость памяти. При этом первые процессоры с микроархитектурой Nehalem, которые будут выпущены в четырёхъядерном варианте, получат трёхканальный контроллер памяти с поддержкой DDR3 SDRAM. Таким образом, настольные системы, построенные на новых процессорах, смогут похвастать непревзойдённой пропускной способностью подсистемы памяти, которая в случае использования трёх модулей DDR3-1067 достигнет 25,6 Гбайт/с. Впрочем, основное преимущество переноса контроллера DRAM в процессор заключается не столько в росте пропускной способности, сколько в уменьшении латентности подсистемы памяти. Несмотря на то, что Intel предлагает использовать с новыми процессорами DDR3 память, отличающуюся относительно высокой латентностью, задержки при обращении Nehalem к памяти будут в любом случае ниже, чем в системах, основанных на процессорах Core 2 и использующих DDR3 SDRAM (и, наверняка, DDR2 SDRAM). Для подтверждения этих слов хотелось бы привести данные, полученные при измерении практических параметров подсистемы памяти системы на базе Nehalem в тестовой утилите Everest 4.60.

Таблица 2. Тестирование работы памяти

Собственно, даже работая в одноканальном режиме, контроллер памяти Nehalem способен показать лучшую производительность, чем контроллер памяти сегодняшних LGA775 платформ. Это совершенно закономерный результат, так как на пути между процессором и памятью в системах нового поколения нет никаких промежуточных устройств – в то время как ранее за работу с памятью отвечал северный мост чипсета, который вносил собственные весьма существенные задержки, вызванные необходимостью синхронизации шин памяти и FSB. Ещё одно косвенное преимущество встроенного в процессор памяти заключается в том, что его функционирование теперь не зависит ни от чипсета, ни от материнской платы. В результате, Nehalem будет показывать одинаковую скорость работы с памятью при работе в платформах различных разработчиков и производителей.

Соседние файлы в папке Задания к практическим работам