
Инструкции sse3
ADDSUBPD (Add Subtract Packed Double).
ADDSUBPS (Add Subtract Packed Single).
HADDPD (Horizontal Add Packed Double).
HADDPS (Horizontal Add Packed Single).
HSUBPD (Horizontal Subtract Packed Double).
HSUBPS (Horizontal Subtract Packed Single).
FISTTP — преобразование вещественного числа в целое с сохранением целочисленного значения и округлением в сторону нуля.
LDDQU — загрузка 128bit невыровненных данных из памяти в регистр xmm, с предотвращением пересечения границы строки кеша.
Процессоры с поддержкой sse3
AMD:
Athlon 64 (начиная с Venice Stepping E3 и San Diego Stepping E4)
Athlon 64 X2
Athlon 64 FX (since San Diego Stepping E4)
Opteron (начиная с Stepping E4)
Sempron (начиная с Palermo. Остановлено в E3)
Phenom
Phenom II
Athlon II
Turion 64
Turion 64 X2
Intel:
Celeron D
Celeron 420, 430 and 440
Pentium 4 (начиная с Prescott)
Pentium D
Pentium Dual-Core
Pentium Extreme Edition (но НЕ Pentium 4 Extreme Edition)
Intel Core Duo
Intel Core Solo
Intel Core 2 Duo
Intel Core 2 Extreme
Intel Core 2 Quad
Xeon (начиная с Nocona)
Atom
Intel Core i5
Intel Core i7
VIA/Centaur:
C7
Nano
Transmeta
Efficeon TM88xx (NOT Model Numbers TM86xx)
5. SSE4
SSE4 — новый набор команд микроархитектуры Intel Core, впервые реализованный в процессорах серии Penryn (не следует путать с SSE4A от AMD).
Он был анонсирован 27 сентября 2006 года, однако детальное описание стало доступно только весной 2007 года
SSE4 состоит из 54 инструкций, 47 из них относят к SSE4.1 (они есть в процессорах Penryn). Полный набор команд (SSE4.1 и SSE4.2, то есть 47 + оставшиеся 7 команд) доступен только в процессорах Intel с микроархитектурой Nehalem, которые были выпущены в середине ноября 2008 года. Ни одна из SSE4 инструкций не работает с 64-х битными mmx регистрами (только с 128-ми битными xmm0-15).
Изменения
Добавлены инструкции, ускоряющие компенсацию движения в видеокодеках, быстрое чтение из USWC памяти, множество инструкций для упрощения векторизации программ компиляторами. Кроме того, в SSE4.2 добавлены инструкции обработки строк 8/16 битных символов, вычисления CRC32, popcnt. Впервые в SSE4 регистр xmm0 стал использоваться как неявный аргумент для некоторых инструкций.
Новые инструкции SSE4.1: Ускорение видео, Векторные примитивы, Вставки/извлечения, Скалярное умножение векторов, Смешивания, Проверки бит, Округления, Чтение WC памяти.
Новые инструкции SSE4.2: Обработка строк, Подсчет CRC32, Подсчет популяции единичных бит, Векторные примитивы.
Процессоры, поддерживающие sse4
Семейство Penryn процессоров Intel (ядра Wolfdale, Yorkfield и более новые)
Семейство Nehalem от Intel.
6. 3DNow!
3DNow! — дополнительное расширение MMX для процессоров AMD, начиная с AMD K6 3D. Причиной создания 3DNow! послужило стремление завоевать превосходство над процессорами производства компании Intel в области обработки мультимедийных данных.
Технология 3DNow! ввела 21 новую команду процессора и возможность оперировать 32-битными вещественными типами в стандартных MMX-регистрах. Также были добавлены специальные инструкции, оптимизирующие переключение в режим MMX/3DNow! (femms, которая заменяла стандартную инструкцию emms) и работу с кэшем процессора. Таким образом технология 3DNow! расширяла возможности технологии MMX, не требуя введения новых режимов.
Расширенная 3DNow!(Enhanced 3DNow!) содержит 19 мультимедийных инструкций и 5 DSP(Digital Signal Processor) инструкций. Эти мультимедийные инструкции переносят понятие 3D графики на новую высоту. 5 DSP инструкций помогают снизить утилизацию (загрузку) процессора при использовании софт-модема, проигрывания МР3 файлов, софт ADSL, Dolby Digital звука.
Последняя версия 3DNow! — 3DNow! Professional — добавляет 51 инструкцию SSE к набору команд 3DNow! Enhanced, благодаря чему процессоры AMD в полной мере поддерживают все возможности SSE.