
- •Вопросы
- •Виды параллельной обработки данных на эвм
- •Параллелизм на уровне машинных команд.
- •Структура оперативной памяти.
- •Секция ввода/вывода
- •Секция межпроцессорного взаимодействия
- •Регистровая структура Cray c90
- •Понятие векторн обр-ки, зацепл фу(Cray c90) Векторная обработка
- •Функциональные устройства
- •Независимость функциональных устройств
- •Зацепление функциональных устройств
- •Закон Амдала .Время разгона конвейера Закон Амдала и его следствия
- •Причины уменьшения производительности Cray c90
- •Суммарное влияние отрицательных факторов на производительность компьютера
- •Архитектура компьютера EarthSimulator.
- •Массивно-параллельные компьютеры, общие черты
- •Общая структура компьютера cray t3d
- •Вычислительные узлы и процессорные элементы
- •Коммуникационная сеть
- •Топология сети, чередование вычислительных узлов
- •Маршрутизация в сети и сетевые маршрутизаторы.
- •Нумерация вычислительных узлов.
- •Особенности синхронизации процессорных элементов
- •Причины уменьшения производительности компьютера Cray t3e/d.
- •Вычислительные кластеры:узлы,коммуникационная сеть (латентность, пропускная способность).
- •История проекта Beowulf
- •Общая характеристика Hewlett-PackardSuperdome.
- •Предсказание ветвлений
- •Причины уменьшения производительности
- •Графовые модели программ, их взаимосвязь.
- •Mpi. Терминология и обозначения
- •Общие процедуры mpi
- •Mpi: синхронное и асинхронное взаимодействие процессов. Прием/передача сообщений между отдельными процессами
- •Прием/передача сообщений с блокировкой
- •Совмещенные прием/передача сообщений
- •Mpi: коммуникаторы
- •Коллективные взаимодействия процессов
- •Mpi: глобальные операции, барьеры Синхронизация процессов в mpi происходит посредством единственной функции
- •Транспьютер: основы архитектуры и его характеристика.
- •Оценки быстродействия вычислительных систем. Тесты производительности сети. Тесты производительности файловой системы. Тесты производительности процессора. Комбинированные тесты
- •Тесты производительности сети
- •Тесты производительности файловой системы
- •Тесты производительности процессора
- •Комбинированные тесты
- •Терминология
- •Классификация Флинна
- •Дополнения Ванга и Бриггса к классификации Флинна
- •Классификация Фенга
- •Классификация Шора
- •Классификация Хендлера
- •Классификация Хокни
- •Классификация Шнайдера
- •Классификация Джонсона
- •Классификация Базу
- •Классификация Кришнамарфи
- •Классификация Скилликорна
- •Классификация Дазгупты
- •Классификация Дункана
- •Принципы разработки современных парраллельных компьютеров.
- •Конвейерная организация Простейшая организация конвейера и оценка его производительности
- •Структурные конфликты и способы их минимизации
- •Конфликты по данным, остановы конвейера и реализация механизма обходов
- •Сокращение потерь на выполнение команд перехода и минимизация конфликтов по управлению
- •Ожидающие функции
- •Виды функций активации
- •Алгоритм решения задач с помощью мсп
- •Формализация задачи
- •Методы обучения
- •Сеть с линейным поощрением
- •Место нейронных сетей среди других методов решения задач
Тесты производительности сети
Название |
Краткое описание |
MPI-тесты |
Система тестов для определения эффективности программно-аппаратной среды выполнения параллельных приложений (на базе MPI). Тесты разработаны лаборатории МГУ. |
comm |
Тесты для измерения латентности и пропускной способности каналов в рамках MPI и PVM. Авторы: Jack Dongarra и Tom Dunigan. |
Netperf |
Тест производительности сети. Включает тесты скорости передачи (bandwidth)и задержки (latency) по протоколам TCP и UDP, используя BSD sockets, DLPI, Unix Domain Sockets, the Fore ATM API и HP HiPPI Link Level Access. |
Nettest |
Тест производительности сети, разработанный в Cray Research. |
ttcp |
Определяет скорость обменов по протоколам TCP и UDP между двумя машинами. |
Тесты производительности файловой системы
Название |
Краткое описание |
Bonnie |
Тестируется ряд стандартных файловых операций: вывод (посимвольно и блоками), обновление, чтение (посимвольно и блоками), перемещение по файлу. Выдается скорость (KB/sec) и степень загрузки ЦП. |
IOZONE |
Тест IOZONE записывает на большой диск X-мегабайтный последовательный файл Y-байтными блоками, потом переворачивает его и считывает. |
Nfsstone |
Измеряет производительность файловой подсистемы NFS. |
Nhfsstone |
Измеряет производительность файловой подсистемы NFS.(см. SPEC) |
Тесты производительности процессора
Название |
Краткое описание |
C LINPACK |
Тест LINPACK, переписанный на языке С. |
CPU2 |
Набор из 34 фортрановских программ, интенсивно работающих с вещественной арифметикой. Производительность измеряется в единицах, эквивалентных производительности MicroVAX II. |
Dhrystone |
Тест целочисленной арифметики, показателен в системном программировании. Не учитывает производительности кэш-памяти. |
Flops |
Вычисляет производительность в MFLOPS на определенных последовательностях инструкций FADD, FSUB, FMUL и FDIV. Работает как на скалярных, так и на векторных машинах. |
Heapsort |
Целочисленная программа, сортирующая 2MB-массив из целых чисел. |
LFK (Livermore Loops) |
Состоит из 24 циклов, представляющих собой характерные вычисления из различных областей прикладной физики. Вычисляет эффективность соответствующих фрагментов в MFLOPS с тремя наборами длин векторов. |
LINPACK |
Тест состоит в решении системы линейных уравнений с помощью LU-факторизации. Основное время затрачивается на векторные операции типа FMA (умножение и сложение). Производительность определяется как количество "полезных" вычислительных операций над числами с плавающей точкой в расчете на 1 секунду, и выражается в Мфлоп/сек (миллионах операций в секунду). Число выполненных операций с плавающей точкой оценивается по формуле 2n3/3 + 2n2(здесь n - размер задачи, т.е. матрица имеет размеры n x n). Таким образом, при увеличении размера матрицы в 2 раза, объем используемой памяти увеличивается примерно в 4 раза, а объем вычислений - примерно в 8 раз. Есть версии, работающие с матрицами 100х100 и 1000х1000, а также с варьируемым размером матрицы (LINPACK HPC). Автор теста - Jack Dongarra. Результаты теста используются при составлении рейтингаTop500.
|
Matrix Multiply (MM) |
Тест содержит 9 различных программ умножения матриц (размером 500х500). Оценивается работа кэш-памяти и уровень оптимизации компилятора. |
NAS Kernels |
Последовательная версия NAS CFD (computational fluid dynamics) |
NPB (NAS Parallel Benchmarks) |
Состоит из 8 различных программ для определения производительности параллельных компьютеров. Программы взяты из реальных аэро-космических расчетных пакетов. |
PERFECT |
Представляет собой комплект из 13 прикладных Fortran-программ, представляющих четыре типа вычислительных задач - аэро- и гидродинамики, моделирования химических и физических процессов, инженерного проектирования, а также обработки сигналов. Выполняется дважды - до и после оптимизации исходных текстов. |
SLALOM |
Масштабируемый тест производительности для супер-компьютеров. Оценивает объем вычислений, который может произвести компьютер за одну минуту. |
Stanford |
Тестовый набор, состоящий из 8 целочисленных тестов (умножение матриц, сортировка 3 методами, перестановки, ханойская башня, растановка 8 ферзей, головоломка ) и 2 тестов на вещественные вычисления (быстрое преобразование Фурье, перемножение матриц) |
STREAM |
Синтетический тест*, оценивающий скорость работы с памятью с простой арифметикой и без. Основан на измерении времени выполнения больших векторных операций: копирование по памяти, умножение на константу, сложение, умножение и сложение. Доступны версии на Фортране и Си. Результатами теста пользуются все ведущие разработчики высокопроизводительной техники. |
Whetstone |
Синтетический тест*, ориентированный на численное программирование (с плавающей запятой). Не учитывает кэш. Компилятор легко можно оптимизировать под Whetstone. |