Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практическая работа №6.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
180.22 Кб
Скачать

Инструкции sse3

  • ADDSUBPD (Add Subtract Packed Double).

  • ADDSUBPS (Add Subtract Packed Single).

  • HADDPD (Horizontal Add Packed Double).

  • HADDPS (Horizontal Add Packed Single).

  • HSUBPD (Horizontal Subtract Packed Double).

  • HSUBPS (Horizontal Subtract Packed Single).

  • FISTTP — преобразование вещественного числа в целое с сохранением целочисленного значения и округлением в сторону нуля.

  • LDDQU — загрузка 128bit невыровненных данных из памяти в регистр xmm, с предотвращением пересечения границы строки кеша.

Процессоры с поддержкой sse3

  • AMD:

    • Athlon 64 (начиная с Venice Stepping E3 и San Diego Stepping E4)

    • Athlon 64 X2

    • Athlon 64 FX (since San Diego Stepping E4)

    • Opteron (начиная с Stepping E4)

    • Sempron (начиная с Palermo. Остановлено в E3)

    • Phenom

    • Phenom II

    • Athlon II

    • Turion 64

    • Turion 64 X2

  • Intel:

    • Celeron D

    • Celeron 420, 430 and 440

    • Pentium 4 (начиная с Prescott)

    • Pentium D

    • Pentium Dual-Core

    • Pentium Extreme Edition (но НЕ Pentium 4 Extreme Edition)

    • Intel Core Duo

    • Intel Core Solo

    • Intel Core 2 Duo

    • Intel Core 2 Extreme

    • Intel Core 2 Quad

    • Xeon (начиная с Nocona)

    • Atom

    • Intel Core i5

    • Intel Core i7

  • VIA/Centaur:

    • C7

    • Nano

  • Transmeta

    • Efficeon TM88xx (NOT Model Numbers TM86xx)

5. SSE4

SSE4 — новый набор команд микроархитектуры Intel Core, впервые реализованный в процессорах серии Penryn (не следует путать с SSE4A от AMD).

Он был анонсирован 27 сентября 2006 года, однако детальное описание стало доступно только весной 2007 года

SSE4 состоит из 54 инструкций, 47 из них относят к SSE4.1 (они есть в процессорах Penryn). Полный набор команд (SSE4.1 и SSE4.2, то есть 47 + оставшиеся 7 команд) доступен только в процессорах Intel с микроархитектурой Nehalem, которые были выпущены в середине ноября 2008 года. Ни одна из SSE4 инструкций не работает с 64-х битными mmx регистрами (только с 128-ми битными xmm0-15).

Изменения

Добавлены инструкции, ускоряющие компенсацию движения в видеокодеках, быстрое чтение из USWC памяти, множество инструкций для упрощения векторизации программ компиляторами. Кроме того, в SSE4.2 добавлены инструкции обработки строк 8/16 битных символов, вычисления CRC32, popcnt. Впервые в SSE4 регистр xmm0 стал использоваться как неявный аргумент для некоторых инструкций.

Новые инструкции SSE4.1: Ускорение видео, Векторные примитивы, Вставки/извлечения, Скалярное умножение векторов, Смешивания, Проверки бит, Округления, Чтение WC памяти.

Новые инструкции SSE4.2: Обработка строк, Подсчет CRC32, Подсчет популяции единичных бит, Векторные примитивы.

Процессоры, поддерживающие sse4

  • Семейство Penryn процессоров Intel (ядра Wolfdale, Yorkfield и более новые)

  • Семейство Nehalem от Intel.

6. 3DNow!

3DNow! — дополнительное расширение MMX для процессоров AMD, начиная с AMD K6 3D. Причиной создания 3DNow! послужило стремление завоевать превосходство над процессорами производства компании Intel в области обработки мультимедийных данных.

Технология 3DNow! ввела 21 новую команду процессора и возможность оперировать 32-битными вещественными типами в стандартных MMX-регистрах. Также были добавлены специальные инструкции, оптимизирующие переключение в режим MMX/3DNow! (femms, которая заменяла стандартную инструкцию emms) и работу с кэшем процессора. Таким образом технология 3DNow! расширяла возможности технологии MMX, не требуя введения новых режимов.

Расширенная 3DNow!(Enhanced 3DNow!) содержит 19 мультимедийных инструкций и 5 DSP(Digital Signal Processor) инструкций. Эти мультимедийные инструкции переносят понятие 3D графики на новую высоту. 5 DSP инструкций помогают снизить утилизацию (загрузку) процессора при использовании софт-модема, проигрывания МР3 файлов, софт ADSL, Dolby Digital звука.

Последняя версия 3DNow! — 3DNow! Professional — добавляет 51 инструкцию SSE к набору команд 3DNow! Enhanced, благодаря чему процессоры AMD в полной мере поддерживают все возможности SSE.