
- •21. Классификация компьютеров по областям применения. Общие требования, предъявляемые к современным компьютерам.
- •22. Числовая и нечисловая обработка. Ограничения фоннеймановской архитектуры.
- •23. Концепция параллельной обработки данных.
- •24. Концепция конвейерной обработки
- •25. Векторные конвейерные процессоры.
- •26. Ассоциативный процессор
- •28. Задача Эрланга.
- •29. Одноканальная смо с неограниченной очередью.
- •30. Многоканальная смо с неограниченной очередью.
- •31. Понятие компьютерных сетей и базовые топологии лвс.
- •32. Методы доступа к общей шине в лвс.
- •33. Топология глобальной вычислительной сети (гвс).
- •34. Сетевые протоколы и уровни.
- •35. Модуляция и демодуляция в сетях. Емкость канала связи.
- •36. Кодирование информации.
- •37. Уплотнение информационных потоков. Организация фаз коммутации.
- •38. Виды протоколов канального уровня. Анализ их производительности.
- •39. Методы коммутации в сетях
- •40. Адреса, протоколы и технологии Internet.
25. Векторные конвейерные процессоры.
Векторные конвейерные процессоры (на примере суперкомпьютера Cray SV1)
Рынок многопроцессорных векторных (векторно-параллельных) суперкомпьютеров достаточно узок. Прежде всего это американская компания SGI, производящая компьютеры с маркой Cray, и японские NEC и Fujitsu. Векторные процессоры NEC SX-5 и Cray SV-1 по-прежнему опережают по производительности вычислений с плавающей запятой самые быстродействующие микропроцессоры.
Из обычных процессоров Cray SV1 можно сконфигурировать так называемые многопоточные процессоры путем объединения четырех стандартных двухконвейерных процессоров в один. SMP-система SV1 может масштабироваться до 32 двухконвейерных центральных процессоров. Общее число каналов GigaRing на систему может при этом достигать восьми.
Архитектура машины Cray-1Cray-1 имеет 12 функциональных устройств. Они разделены на группы в зависимости от типа выполняемых ими операций и адресуемых регистров. Выполняют вычисление адресов, логические, скалярные и векторные операции над целыми числами, операции с плавающей запятой над скалярами и векторами. Большинство простых операций центрального процессора выполняется за один такт, который составляет 12.5 нс.
Производительность однопроцессорной машины Cray-1 составляет примерно 100 000000 операций с плавающей точкой в секунду (100 Мфлопс).
26. Ассоциативный процессор
В ассоциативной памяти параллельный поиск идет сразу по большой группе ячеек и в итоге поисковому признаку может удовлетворять содержимое нескольких ячеек. Возможности выполнения различных видов поиска и разнообразие структур ассоциативной памяти объясняют, почему для обозначения этого устройства существует так много синонимов: память с параллельным поиском, запоминающее устройство с многозначным ответом, память с распределенной логикой, логико-запоминающее устройство и т.д. Одновременность в работе —неотъемлемое свойство ассоциативной памяти, что можно пояснить следующим образом: имеется большое число элементов памяти; поиск идет по всем элементам сразу.
Ассоциативным процессором (АП) называют ассоциативное запоминающее устройство, дополненное логикой и микропрограммным управлением. В основе архитектур ассоциативных процессоров с пословной организацией лежит параллелизм на уровне слов, и в большинстве конфигураций обработка слов выполняется последовательно по разрядам.
Регистр компаранда (компаранд – признак, по которому ведется поиск в АЗУ; он записывается в регистр компарандов, затем пересылается в регистр маски)
Множество слов образует ассоциатив массив или ассоциативное запоминающее устр-во (АЗУ) пословно организованного ассоциативного процессора.
Регистр маски можно (фильтр разрядов регистра компаранда). Выделяет указанный признак, остальные маскирует, т.е. соответствующие разряды регистра маски устанавливаются в 0, а соответствующие полю компаранда, устанавливаются в 1. Обычно каждый регистр хранения ответов представляет собой множество триггеров, образующих одноразрядный двоичный вектор вдоль всего массива АЗУ.
Маска вывода слов – последовательно по словам выводит содержимое АЗУ.
Соединительная сеть – используется для логической комбинации полей в данной физической среде. Контроллер – управляет всеми подсистемами.
27. Концепция вычислительных систем с управлением потоком данных. Закон Амдала и его следствия.
Существуют трудности, связанные с решением проблемы автоматизации параллельного программирования, необходимой в целях эффективного использования для широкого круга задач матричных ВС. Поэтому актуальны исследования новых методов построения высокопроизводительных ВС, одними из которых являются ВС с управлением потоком данных, или потоковые ВС.
В системах с управлением потоками данных предполагается наличие большого числа специализированных операционных блоков для определенных видов операций (сложения, умножения и т.п., отдельных для разных типов данных). Данные снабжаются указателями типа данных (тегами), на основании которых по мере готовности данных к обработке они загружаются в соответствующие свободные операционные блоки. При достаточном количестве операционных блоков может быть достигнут высокий уровень распараллеливания вычислительного процесса.
Принципиальное отличие потоковых машин состоит в том, что команды выполняются не в порядке следования команд в тексте программы, а по мере готовности их операндов.
«Потоковая программа» размещается в массиве ячеек команд. Команда наряду с кодом операции содержит поля, куда заносятся готовые операнды, и поле, содержащее адреса команд, в которые должен быть направлен в качестве операнда результат операции. Кроме того, каждой команде поставлен в соответствие двухразрядный тег (располагаемый в управляющем устройстве), разряды которого устанавливаются «1» при занесении в тело команды соответствующих операндов. В состоянии тега «11» (оба операнда готовы) инициируется запрос к операционному коммутатору (ОК) на передачу готовой команды в соответствующее коду операции операционное устройство. Результат выполнения команды над ее непосредственно адресуемыми операндами направляется через командный коммутатор (КК) согласно указанным в команде адресам в ячейки команд и помещается в их поля операндов. Далее указанная процедура циклически повторяется.
Закон Амдала. Предположим, что в программе доля операций, которые нужно выполнять последовательно, равна f, где 0<=f<=1. Крайние случаи в значениях f соответствуют полностью параллельным (f = 0) и полностью последовательным (f = 1) программам.
Для того, чтобы оценить, какое ускорение U может быть получено на компьютере из n процессоров при данном значении f, можно воспользоваться законом Амдала:
Если 9/10 программы исполняется параллельно, а 1/10 по-прежнему последовательно, то ускорения более, чем в 10 раз получить в принципе невозможно.
Следствие из закона Амдала Для того чтобы ускорить выполнение программы в q раз необходимо ускорить не менее, чем в q раз не менее, чем (1-1/q)-ю часть программы.
Таким образом, для эффективного использования МПС необходимо тщательное согласование структуры программ и алгоритмов с особенностями архитектуры параллельных вычислительных систем.