
- •Зачем применяються суперкомпьютеры
- •Параллельная обработка данных на эвм
- •Классификация параллельных компьютеров и систем
- •Векторно-конвейерные компьютеры
- •Функциональные устройства
- •Секция управления процессора
- •Паралельные компьютеры с общей памятью
- •Вычислительные системы с распределенной памятью
- •Кластерные проекты
- •Система функциональных устройств. Закон амдала.
- •Как повышают производительность компьютеров
- •Усложнение и наращивание аппаратных средств
- •Параллельная обработка
- •Конвейерная обработка
- •Повышение интеллектуальности управления компьютера
- •Технологии параллельного программирования
- •Использование традиционных последовательных языков
- •Технология программирования ОреnМр.
- •Система программирования dvm.
- •Система программирования на mPc.
- •Система программирования на основе передачи сообщения
- •Система программирования mpi
- •Общие функции mpi.
- •Общие функции mpi
- •Прием/передача сообщения между отдельными процессами.
- •Прием/передача сообщения без блокировки.
- •Объединение запросов на взаимодействия.
- •Совмещенные прием и передача сообщений.
- •Коллективные взаимодействия процессов.
- •Синхронизация процессов
- •Работа с группами процессов
Функциональные устройства
Все функциональные устройства у компьютера Cray C90 являются конвейерными. Число ступеней у них различно, однако каждая ступень каждого устройства всегда срабатывает за один такт. Кроме этого, все функциональные устройства независимы и могут работать одновременно друг с другом.
Функциональные устройства данного компьютера делятся на четыре группы: адресные, скалярные, векторные и функциональные устройства для выполнения операций над вещественными числами.
Два адресных функциональных устройства предназначены для выполнения сложения/вычитания и умножения 32-разрядных целых чисел. Скалярных устройств всегда четыре. Они используются для целочисленного сложения/вычитания, логических поразрядных операций, для выполнения операций сдвига и нахождения числа нулей до первой единицы в слове.
Число векторных устройств в зависимости от конфигурации компьютера меняется от пяти до семи. В их число могут входить устройства для целочисленного сложения/вычитания, сдвига, логических поразрядных операций, устройства нахождения числа нулей до первой единицы в слове, для умножения битовых матриц.
Все функциональные устройства предназначены для выполнения только векторных команд.
Три функциональных устройства для вещественной арифметики работают с 64-разрядными числами, представленными в форме с плавающей запятой. Они предназначены для сложения/вычитания, умножения, нахождения обратной величины числа. Отдельного устройства для выполнения явной операции деления вещественных чисел нет. Все устройства данной группы могут выполнять как векторные , так и скалярные команды.
Архитектура Cray C90 позволяет использовать регистр результатов одной векторной операции в качестве входного регистра для последующей векторной операции. Выход одной операции сразу подается на вход другой, причем последняя не обязана ждать завершение первой, а, начиная с некоторого момента, будет работать одновременно с ней. Подобная ситуация называется зацеплением векторных операций.
Секция управления процессора
Команды выбираются из оперативной памяти блоками и заносятся в буфера команд, откуда затем они выбираются для исполнения. Если необходимой для исполнения команд нет в текущем буфере, она ищется в других буферах. Если требуемой команды в буферах не оказалось, то происходит выборка очередного блока.
Среди основных особенностей данной архитектуры , дающих заметный вклад в ускорение выполнения программ, можно назвать следующие.
-
Конвейеризация выполнения команд. Все основные операции, выполняемые процессором, т.е. обращение к памяти, обработка команд и выполнение инструкций функциональными устройствами являются конвейерными.
-
Независимость функциональных устройств. Функциональные устройства в Cray C90 являются независимыми, поэтому несколько операций могут выполнятся одновременно.
-
Векторная обработка. Векторная обработка увеличивает скорость и эффективность обработки за счет того, что обработка целого набора (векторных) данных выполняется одной командой. Скорость выполнения операций в векторном режиме может быть в 10-15 раз выше скорости скалярной обработки.
-
Зацепление функциональных устройств. Возможность выполнения нескольких векторных операций в режиме «макроконвейера» дает дополнительный выигрыш в скорости их обработки.
-
Многопроцессорная обработка. В максимальной конфигурации компьютер может содержать до 16 независимых процессоров. Эти процессоры могут быть использованы по-разному. В частности, они могут выполнять несколько независимых программ, но могут и все быть назначены на выполнения одной программы.