Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 665

.pdf
Скачиваний:
17
Добавлен:
30.04.2022
Размер:
3.51 Mб
Скачать

Таблица 4

Результаты тестирования процессоров

Процессор

Время выполнения теста, с

32K

64K

512K

1M

 

Intel Core i3-4130

0,25

0,28

4,997

11,52

<Текущий процессор>*

 

 

 

 

<Процессор домашнего ПК>*

 

 

 

 

*) указать полное название процессора

4. Для сравнения результатов постройте графики зависимости времени теста от объема обрабатываемых данных и сделайте выводы.

Задание 3. Протестируйте производительность процессора при выполнении типовых задач – видеоконвертирование, аудиобработка, создание видеоконтента.

Порядок выполнения

1. Оцените скорость видеоконвертирования файла с использованием кодека x264 стандарта H.264 [6], для этого:

перейдите в режим командной строки;

запустите первый раз для создания файла со статистикой:

x264 --bitrate=<target_bitrate> --pass 1 -o <output_file> <input_file>

После окончания работы кодека будет создан файл x264_2pass.log с собранной на первом проходе информацией; запустите второй раз для создания файла со статистикой (этот этап может отсутствовать или повторяться несколько раз):

x264 --bitrate=<target_bitrate> --pass 3 -o <output_file> <input_file>

На этом этапе в файле «x264_2pass.log» будет обновляться собранная статистика;

запустите последний раз для записи закодированной последовательности (создаётся файл):

x264 --bitrate=<target_bitrate> --pass 2 -o <output_file> <input_file>

Пример установки параметров кодека для получения видеофайла в формате mkv с битрейтом 700 Кбит/сек, частота

20

кадров – 30 кадров в секунду, алгоритм компенсации движе-

ния «Uneven multi-hexagon» с областью поиска 32x32 пикселя и наилучшим качеством компенсации:

x264 --bitrate=700 --fps=30 --me=umh --merange=32 -- subme=7 --analyse=all -o myfile.mkv myfile.avi

2.Оцените скорость создания видеоконтента с использованием PowerPoint, для этого:

откройте презентацию;

добавьте к ней звуковой файл;

сохраните ее как видеофайл в формате wmv;

определите время создания файла через свойства созданного файла.

3.Измерьте время кодирования звукового файла формата WAV в формат MP3, запустив кодек Lame командной строкой из текущей папки:

Lame-h [имя исход. файла].wav [имя файла результата].mp3

4.Измерьте время архивирования текстового файла в формате doc, rtf, pdf.

5.Оцените время создания компьютерной модели строительного объекта.

Для стандартной сцены Hummer или имеющегося проекта с помощью Autodesk 3ds max 2016 проведите измерение времени, затрачиваемое на рендеринг в разрешении 1920 × 1080 с применением рендерера mental ray [2].

6.Рассчитайте интегральную оценку производительности, для этого:

1) по результатам тестирования заполните таблицу:

Время, с

Текущий

Процессор

 

процессор

домашнего ПК

видеоконвертирования

 

 

создания видеоконтента

 

 

звукового кодирования

 

 

архивирования

 

 

компьютерноемоделирование

 

 

 

21

 

2) для каждого теста вычислите нормированную скорость выполнения задачи:

R=,

где t – время выполнения задачи эталонного и тестируемого процессора;

3) вычислите интегральную оценку как среднее геометрическое нормированных скоростей выполнения всех проведенных тестов.

Задание 4. Проанализируйте влияние особенностей системы команд на производительность процессора. Для определения производительности процессора в текущей конфигурации ПК на синтетических тестах воспользуйтесь программами пакета SiSoftwareSandra (рис. 9).

SiSoftware Sandra (SiSoftware, London, UK, www.sisoftware.eu) – пакет программ для анализа, диагностики и оценки производительности для ПК, серверов, мобильных устройств и сетей [3].

Рис. 9. Окно запуска синтетических тестов процессора

22

Порядок выполнения

1. Закройте все открытые приложения, выберите «Арифметический тест процессора», отключите все опции (для открытия вкладки нажмите CTRL-O) и запустите тест кнопкой «Обновить» (F5). Проведите измерения при включении различных дополнительных наборов команд. Результаты занесите в табл. 5.

Таблица 5 Результаты арифметического теста процессора

Арифметический

Базовый

Расширения набора команд

тест

набор ко-

 

 

 

SSE2

SSE3

другие

 

манд x86

 

 

 

Dhrystone (GIPS)

 

 

 

 

Whetstone

 

 

 

 

(GFLOPS)

 

 

 

 

Для заполнения таблицы включите только одну опцию (например, SSE2), соответствующую включению дополнительного набора команд процессора из доступного AVX512, AVX2 / FMA3, AVX, SSE4, SSE2 и других, и проведите необ-

ходимое число измерений.

Сопоставьте результаты тестов в GIPS и GFLOPS. Исходя из различий полученных оценок, сделайте вывод о влиянии типов операндов и типов команд на производительность процессора.

2.Постройте сравнительные диаграммы производительности исследуемого процессора от задействования различных наборов команд. Сделайте вывод об их влиянии на производительность.

3.Выполните исследования производительности процессора на мультимедийном, криптографическом, научных вычислениях и других доступных синтетических тестах по аналогичной методике. Результаты объясните.

23

2.3. Виды и материалы контроля выполнения работы

По результатам выполнения работы должен быть подготовлен отчет, содержащий:

полную информацию о характеристиках процессора, отражающих его архитектуру и организацию;

графики зависимости времени выполнения бенчмарка SuperPi от объема обрабатываемых данных для трех процессоров;

результаты интегральной оценки производительности двух процессоров на реальных задачах;

выводы по результатам проведенных вычислительных экспериментов;

описание методики тестирования для демонстрации зависимости производительности процессора от форматов обрабатываемых данных, расширения набора команд и других характеристик процессора.

Тестовые задания 1. Одним из эффективных способов повышения произ-

водительности является … а) конвейерная обработка команд; б) разделение кэш-памяти;

в) введение новых кодов команд; г) увеличение адресного пространства.

2. Дополнительный набор команд процессора, предназначенный для шифрования:

а) 3DNow!; б) SSE; в) AVX; г) AES.

3. Увеличение производительности ядра процессора за счет поднятия тактовый частоты имеет жесткое ограничение. Увеличение тактовой частоты влечет за собой повышение температуры процессора, энергопотребления и снижение стабильности его работы и срока службы.

24

Перечислите другие архитектурные приемы для увеличения производительности процессора – конструктивные и тактические.

4.Сравнение производительности по тактовой частоте допустимо … а) для одноядерных процессоров;

б) при отсутствии конвейера; в) если у процессоров объем кэш-памяти одинаков;

г) в рамках одной процессорной архитектуры.

5.Какая из перечисленных команд будет выполняться быстрее:

1)сложение двух операндов с прямой адресацией;

2)декремент операнда с регистровой адресацией;

3)условный переход с относительной адресацией;

4)вызов подпрограммы с непосредственной адресацией?

6.MMX представляет собой …

а) программное управление тактовой частотой; б) способ организации расширенной памяти; в) специальный регистр процессора; г) набор дополнительных команд.

7.Для научно-технических расчетов наиболее подходит процессор с производительностью а) 100ГФЛОПС; б) 1ТМИПС;

в) 1TФЛОПС;

г) 2000 ГИПС.

8.Конвейерная обработка увеличивает производительность процессора … а) одновременным выполнением нескольких команд;

б) сокращением времени выполнения одной команды; в) обработкой большого количества однотипных данных; г) спекулятивным исполнением команд управления.

9.Прикладная программа выполняется на ЭВМ А с тактовой частотой 4 ГГц – 10 с. Перед разработчиками была поставлена задача построить ЭВМ B, чтобы программа выпол-

25

нялась за 6 с. Оказалось, что c повышением тактовой частоты длительность цикла процессора увеличилось в 1,2 раза по сравнению с ЭВМ А. Определите, какое значение тактовой частоты было достигнуто.

10. Функциональные возможности процессора определяет а) тактовая частота; б) производитель; в) система команд;

г) разрядность регистров.

3. ОЦЕНКА ЭФФЕКТИВНОСТИ КЭШ-ПАМЯТИ

Цель работы: анализ структуры кэш-памяти и оценка времени доступа к кэш различного уровня

Программные средства: SiSoftware Sandra Lite, CPU-Z

тест латентности памяти, CacheBurst32

3.1. Характеристики и организация кэш-памяти

Иерархия памяти в вычислительных системах базируется на технике кэширования. Кэш-память представляет собой небольшое по размеру, но быстродействующее по сравнению с нижележащим уровнем запоминающее устройство, предназначенное для промежуточного хранения данных, которые вероятно вскоре потребуются вышележащему уровню.

Принцип функционирования кэш-памяти состоит в следующем. Когда определенное слово вызывается из основной памяти, оно вместе с соседними словами (строкой) переносится в кэш-память, что позволяет при очередном запросе быстро обращаться к следующим словам. Таким образом, использование кэш-памяти позволяет повысить скорость межуровневого взаимодействия в иерархической системе памяти.

Распространено разделение кэш-памяти на одинаковые множества. Каждое множество состоит из M строк по B слов в каждом (рис. 10). Каждая строка имеет бит достоверности

26

Valid и поле тега (Tag), содержащее идентификационную часть адреса основной памяти.

Рис. 10. Структура кэш-памяти

Пример 1. Определение структуры кэш-памяти Пусть кэш-память имеет следующие параметры: длина строки – 4 байта;

общий объем – 16 K байт;

работает с 16-разрядным процессором, формирующим при обращении к оперативной памяти 22-разрядный код адреса;

используется 4-канальная множественно-ассоциативная функция отображения.

Решение. Множественно-ассоциативная функция отображения представляет собой комбинацию прямого и ассо-

27

циативного отображения. При такой реализации весь массив кэш-памяти делится на w множеств, каждый из которых состоит из k строк или каналов. Так M=wxk и i=j mod w, где i – номер секции Кэша; j – номер блока в оперативной памяти.

Для построения структуры кэш-памяти определяем размер слова – 2 байта (16-разрядный процессор), количество слов в строке – 2, количество строк в кэше – 4 K. Кэш разделен на 1 K множеств по 4 строки в каждом, т. е. так:

 

 

 

 

 

 

 

 

 

Множе-

Строка 1

Строка 2

Строка 3

Строка 4

ство

сло-

сло-

сло-

сло-

сло-

сло-

сло-

сло-

 

во 1

во 2

во 1

во 2

во 1

во 2

во 1

во 2

1

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

1024

 

 

 

 

 

 

 

 

Всостав кода адреса входят три поля: тег, номер канала

иномер слова. Для кодирования номера слова необходимо s

бит, где 2s 2 - количество слов в строке, т.е. s=1. Для кодирования номера канала во множестве необходимо d бит, где 2d 4 - количество строк во множестве, т.е. d=2. Поле тега определяет какой именно блок основной памяти находится в данной строке. Адресное пространство процессора составляет 222 4M , кэш состоит из 1K множеств, в каждом из которых может находиться один из 4М/1К=4К блоков, на которые ука-

зывает тег, следовательно, 2t 4 210 4098 необходимо 12 разрядов для их кодирования.

Пример 2. Определение размера тега кэш-памяти с прямым отображением объемом 64 Кбайт и 16 К=214 строк по 4 байта в каждой.

Решение. При прямом отображении за каждым блоком ОП закрепляется строка кэш. Для определения номера строки кэш используется соотношение:

28

i=j mod M,

где j – номер строки в ОП;

M – количество строк в кэш.

Интерпретация адреса слова ОП для поиска информации в кэш следующая:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(s- r)

 

 

 

r

 

 

 

w

тег, определяющий

порядковый

порядковый

номер блока ОП

номер строки

номер слова

к строке

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Количество слов в строке – 2w , т.е. w=2 для 4 слов.

Количество строк в кэше – 2r , т.е. r=14 для кэш объемом 16 Кбайт.

Размер тега определяется на основании длины адреса (s+w), и для ОП емкостью 16 Мбайт=224 получаем s+w=24, т.е. s=22 и тег составляет s-r=8 бит. Получена следующая схема интерпретации адреса:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(s- r)

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

w

5

 

4

3

2

1

 

 

0

Тег представлен двумя старшими (5-4) шестнадцатеричными разрядами.

Все стратегии размещения блоков основной памяти в кэше могут быть представлены как вариации множественной ассоциативности. Кэш с прямым отображением является просто одноканальной множественно-ассоциативной памятью, так как каждая строка может содержать только один определенный блок ОП. Полностью ассоциативная кэш-память с k строками – это k-канальная память, где каждый блок ОП может находиться в любой из k строк.

Пример 3. Вычисление среднего времени доступа к данным для процессора с тактовой частотой 1ГГц, задержкой

29