
- •Лекция 8 Параллельные системы
- •Кластерный подход к созданию параллельных систем
- •Использование параллельных вычислительных систем
- •Производительность вычислительных систем
- •Cверхсложные вычислительные задачи, решаемые на суперкомпьютерах
- •Мета-компьютинг
- •Примеры многопроцессорных систем
- •Наиболее известные многопроцессорные компьютеры
- •Hp 9000 (Exemplar)
- •Cray t90
- •Системы создания параллельных программ
Производительность вычислительных систем
Часто производительность вычислительных систем выражается в «Мфлопс» (Millions of FLoating point OPerations per Second» и означает «Миллион операций с плавающей точкой в секунду».
MFLOPS часто употребляется изготовителями высокопроизводительных вычислительных систем для указания их вычислительной мощности при операциях с «числами с плавающей точкой». К сожалению, практически всегда не указывается, что именно обозначает указанное число «MFLOPS».
Некоторые производители просто перемножают производительность MFLOPS для одного процессора на число процессоров и таким образом получают результат.
Тесты производительности (benchmarks) - общие сведения
Тесты производительности (benchmarks) - это тесты, измеряющие производительность систем, или подсистем, на решении заранее определенных задач или наборов задач.
Результаты тестов производительности обычно используются для предсказания производительности незнакомой (не купленной, не установленной) системы при решении (заранее определенных) задач пользователя и для сравнения производительности систем или подсистем для некоторого класса задач.
Тесты производительности также могут быть использованы и при контроле, диагностике и настройке систем для выявления «узких мест» и плохо работающих/ненастроенных подсистем.
Тесты производительности чаще всего измеряют обобщенные показатели производительности систем или подсистем, таких как графическая подсистема, подсистема ввода/вывода, процессор (для операций с целыми числами и для операций с «числами с плавающей запятой») и т.д., однако, многие тесты измеряют производительность при решении конкретных, но типичных задач, таких как отображение многоугольников, чтение и запись файлов или операции над матрицами.
Каждая организация или подразделение, занимающееся решением своих задач на компьютерах, может (что, в принципе, весьма полезно, если будет сделано грамотно) создать свой набор тестов производительности, которые будут наиболее точно отражать специфику задач, решаемых данным подразделением Частным случаем такого теста может быть решение реальных задач с фиксированными исходными данными и измерение времени решения. Главный недостаток таких тестов - либо результаты будут известны только для систем, которые доступны авторам, либо авторы должны широко распространить свои тесты и убедить других людей проводить их и публиковать (сообщать) результаты;
Тесты LINPACK
Эти тесты родились из библиотеки подпрограмм для задач линейной алгебры «LINPACK». Первоначально тест был написан на языке Fortran (и сейчас часто используется эта версия теста), существует и версия на языке «C». Основное время теста занимает внутренний цикл, выполняющий типичную для действий с матрицами операцию
y(i) = y(i) + a * x(i).
Стандартная версия теста оперирует с матрицами 100 * 100, однако, есть версии для матриц размерами 300 * 300 и 1000 * 1000 с различными правилами оптимизации. Тест LINPACK достаточно хорошо векторизуется и распараллеливается на большинстве систем.
Основной недостаток теста LINPACK - он дает имеющие смысл результаты только для вычислений приведенного выше вида.
TOP500
Существует список 500 самых мощных компьютеров мира. Официальная страница Top500 находится по адресуwww.top500.org. По данным 27-й редакции списка на июнь 2006 года самым производительным компьютером являетсяeServer Blue Gene Solution (IBM), содержащий 131072 процессора с пиковой производительностью 367 TFlops.
Самый производительный компьютер, работающий в России, занимает в этом списке 70-ю строчку: MVS-15000BM, eServer BladeCenter JS20 (PowerPC970 2.2 GHz), Myrinet IBM, содержит 1148 процессоров и обладает пиковой производительностью 10 TFlops.