Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уфимский Государственный Авиационный Технический Университет

Предмет:

Аппаратное обеспечение ЭВМ, средств телекоммуникаций и сетей

Файл:

Танненбаум Е. Архітектура компютера [pdf]

.pdf

Скачиваний:

103

Добавлен:

02.05.2014

Размер:

5.59 Mб

Скачать

☆

<<< < Предыдущая 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 6263 / 7063 64 65 66 67 68 69 70 > Следующая >>>

Мультикомпьютеры с передачей сообщений

менее стандартных узлов, которые связаны друг с другом высокоскоростной тью. Поэтому ниже мы просто рассмотрим несколько конкретных примеров с тем МРР: Cray T3E и Intel/Sandia Option Red.

СгауТЗЕ

В семейство ТЗЕ (последователя T3D) входят самые последние суперкомпьюте восходящие к компьютеру 6600. Различные модели — ТЗЕ, ТЗЕ-900 и ТЗЕ-120 идентичны с точки зрения архитектуры и различаются только ценой и произво тельностью (например, 600, 900 или 1200 мегафлопов на процессор). Мегафло это 1 млн операций с плавающей точкой/с. (FLOP — FLoating-point OPeration операции с плавающей точкой). В отличие от 6600 и Сгау-1, в которых очень м параллелизма, эти машины могут содержать до 2048 процессоров. Мы использ термин ТЗЕ для обозначения всего семейства, но величины производительно будут приведены для машины ТЗЕ-1200. Эти машины продает компания C Research, филиал Silicon Graphics. Они применяются для разработки лекарств ных препаратов, поиска нефти и многих других задач.

В системе ТЗЕ используются процессоры DEC Alpha 21164. Это суперскал ный процессор RISC, способный выдавать 4 команды за цикл. Он работает с ч тотой 300, 450 и 600 МГц в зависимости от модели. Тактовая частота — основ различие между разными моделями ТЗЕ. Alpha — это 64-битная машина с 64-б ными регистрами. Размер виртуальных адресов ограничен до 43 битов, а физич ких — до 40 битов. Таким образом, возможен доступ к 1 Тбайт физической пам

Каждый процессор Alpha имеет двухуровневую кэш-память, встроенную в м росхему процессора. Кэш-память первого уровня содержит 8 Кбайт для коман 8 Кбайт для данных. Кэш-память второго уровня — это смежная трехвходовая социативная кэш-память на 96 Кбайт, содержащая и команды и данные вме Кэш-память обоих уровней содержит команды и данные только из локального О а это может быть до 2 Гбайт на процессор. Поскольку максимальное число про соров равно 2048, общий объем памяти может составлять 4 Тбайт.

Каждый процессор Alpha заключен в особую схему, которая называется о лочкой (shell) (рис. 8.29). Оболочка содержит память, процессор передачи дан

и512 специальных регистров (так называемых Е-регистров). Эти регистры м загружаться адресами удаленной памяти с целью чтения или записи слов из ленной памяти (или блоков из 8 слов). Это значит, что в машине ТЗЕ есть дос к удаленной памяти, но осуществляется он не с помощью обычных команд L

иSTORE. Эта машина представляет собой гибрид между NC-NUMA и МРР, но таки больше похожа на МРР. Непротиворечивость памяти гарантируется, поско ку слова, считываемые из удаленной памяти, не попадают в кэш-память.

Узлы в машинеТЗЕ связаныдвумя разными способами (см. рис. 8.29). Основ

6 2 4 Глава 8 Архитектуры компьютеров параллельного действия

		Сеть		Диск		Магнитофон
				GigaRing
			*		-
	Alpha	Память	Alpha	Память		Alpha	П
	1	-	4 -	1		4	-
Оболочка-	Регистры		Регистры			Регистр
	управления+		управления+			управлени
	Е-регистры		Е-регистры			Е-регист
			1			Процесс
t	Процессор		Процессор		!
Узел	передачи		передачи			передач
	данных		данных			данных

Дуплексный трехмерный тор

Рис.8.29.CrayResearchT3E

Узлы также связаны одним или несколькими GigaRings — подсистема да-вывода с коммутацией пакетов, обладающими высокой пропускной спос тью Узлы используют эту подсистему для взаимодействия друг с другом, с сетями, дисками и другими периферическими устройствами. Они по ней лают пакеты размером до 256 байтов. Каждый GigaRing состоит из пары шириной в 32 бита, которые соединяют узлы процессоров со специальным ми ввода-вывода. Узлы ввода-вывода содержат гнезда для сетевых карт ( мер, HIPPI, Ethernet, ATM, FDDI), дисков и других устройств.

В системе ТЗЕ может быть до 2048 узлов, поэтому неисправности будут ходить регулярно. По этой причине в системе на каждые 128 пользовате узлов содержится один запасной узел. Испорченные узлы могут быть зам запасными во время работы системы без перезагрузки Кроме пользователь запасных узлов есть узлы, которые предназначены для запуска серверов ционной системы, поскольку пользовательские узлы запускают не всю с а только ядро. В данном случае используется операционная система UNIX

Intel/Sandia Option Red

Компьютеры с высокой производительностью и вооруженные силы идут

Мультикомпьютеры с передачей сообщений

ветственно. Для сравнения: 100 терафлопов (1014 операций с плавающей точко в секунду) — это в 500000 раз больше, чем мощность процессора Pentium Pr работающего с частотой 200 МГц.

В отличие от машины ТЗЕ, которую можно купить в магазине (правда, за бол шие деньги), машины, работающие со скоростью 1014 операций с плавающей то кой, — это уникальные системы, распределяемые в конкурентных торгахДепарт ментомэнергетики,которыйруководитнациональнымилабораториями. Компани Intel выиграла первый контракт; IBM выиграла следующие два. Если вы планир ете вступить в соревнование в будущем, вам понадобится 80 млн долларов. Эт машины предназначены для военных целей. Какой-то сообразительный работни Пентагона придумал патриотические названия для первых трех машин: red, whi и blue (красный, белый и синий — цвета флага США). Первая машина, выполняв шая 1014 операций с плавающей точкой, называлась Option Red (Sandia Nation Laborotary, декабрь 1996), вторая — Option Blue (1999), а третья — Option Whi (2000). Ниже мы будем рассматривать первую из этих машин, Option Red.

Машина Option Red состоит из 4608 узлов, которые организованы в трехмер ную сетку. Процессоры запакованы на платах двух разных типов. Платы kestr используются в качестве вычислительных узлов, а платы eagle используютс для сервисных, дисковых, сетевых узлов и узлов загрузки. Машина содержи 4536 вычислительных узлов, 32 сервисных узла, 32 дисковых узла, 6 сетевых узло и 2 узла загрузки.

Плата kestrel (рис. 8.30, а) содержит 2 логических узла, каждый из которы включает 2 процессора Pentium Pro на 200 МГц и разделенное ОЗУ на 64 Мбай Каждый узел kestrel содержит собственную 64-битную локальную шину и собствен ную микросхему NIC (Network Interface Chip — сетевой адаптер). Две микро схемы NIC связаны вместе, поэтому только одна из них подсоединена к сети, чт делает систему более компактной. Платы eagle также содержат процессор Pentium Pro, но всего два на каждую плату. Кроме того, они отличаются высоко производительностью процесса ввода-вывода.

Платы связаны в виде решетки 32x38x2 в виде двух взаимосвязанных плоско стей 32x38 (размер решетки продиктован целями компоновки, поэтому не во все узлах решетки находятся платы). В каждом узле находится маршрутизатор с шес тью каналами связи: вперед, назад, вправо, влево, с другой плоскостью и с плато kerstel или eagle. Каждый канал связи может передавать информацию одновре менно в обоих направлениях со скоростью 400 Мбайт/с. Применяется маршрути зация «червоточина», чтобы сократить время ожидания.

Применяется пространственная маршрутизация, когда пакеты сначала потенци ально перемещаются в другую плоскость, затем вправо-влево, затем вперед-назад наконец, в нужную плоскость, если они еще не оказались в нужной плоскости. Дв

6 2 6 Глава 8. Архитектуры компьютеров параллельного действия

	64-битная локальная шина			Плата
	64-битная локальная шина			"kestrel
Pentium	Pentium	64	Ввод-	Сетевой
Pro	Pro	Мбайт	вывод	адаптер
Pentium	Pentium	64	Ввод-	Сетевой
Pro	Pro	Мбайт	вывод	адаптер
	64-битная локальная шина
		а		б

Рис. 8.30. Система Intel/Sandia Option Red: плата kestrel (а); сеть (б)

Систему можно логически разделить на 4 части: сервис, вычисление, в вод и система. Сервисные узлы — это машины UNIX общего назначения лением времени, которые позволяют программистам писать и отлажив программы. Вычислительные узлы запускают большие приложения. Они ют невсюсистему UNIX,атолькомикроядро, которое называетсякугуаром( Узлы ввода-вывода управляют 640 дисками, содержащими более 1 Тбайт Есть два независимых набора узлов ввода-вывода. Узлы первого типа пред ны для секретной военной работы, а узлы второго типа — для несекретной Эти два набора вводятся и удаляются из системы вручную, поэтому в момент времени подсоединен только один набор узлов, чтобы предотвратит информации с секретныхдисков на несекретные диски. Наконец, системн используются для загрузки системы.

COW — Clusters of Workstations (кластеры рабочих станций)

Второй тип мультикомпьютеров — это системы COW (Cluster ofWorkst кластер рабочих станций) или NOW (Network of Workstations — сеть станций) [8,90]. Обычно он состоит из нескольких сотен персональных ко ров или рабочих станций, соединенных посредством сетевых плат. Различи МРР и COW аналогично разнице между большой вычислительной машиной нальнымкомпьютером. Уобоихестьпроцессор, ОЗУ,диски, операционная

ит. д. Но в большой вычислительной машине все это работает гораздо (за исключением, может быть, операционной системы). Однако они прим

иуправляются по-разному. Это же различие справедливо для МРР и CO

Процессоры в МРР — это обычные процессоры, которые любой челове

Мультикомпьютеры с передачей сообщений

Исторически система МРР отличалась высокоскоростной сетью. Но с появл нием коммерческих высокоскоростных сетей это отличие начало сглаживатьс Например, исследовательская группа автора данной книги собрала систему COW которая называется DAS (Distributed ASCII Supercomputer). Она состоит и 128 узлов, каждый из которых содержит процессор Pentium Pro на 200 МГц и ОЗ на 128 Мбайт (см. http://www.cs.vu.nl/~baL/das.htmt). Узлы организованы в 2-ме ный тор. Каналы связи могут передавать информацию со скоростью 160 Мбайт в обоих направлениях одновременно. Эти характеристики практически не отлич ются от характеристик машины Option Red: скорость передачи информации п каналам связи в два раза ниже, но размер ОЗУ каждого узла в два раза больш Единственное существенное различие состоит в том, что бюджет Sandia был зн чительно больше. Технически эти две системы практически не различаются.

Преимущество системы COW над МРР в том, что COW полностью состоит и доступных компонентов, которые можно купить. Эти части выпускаются больш ми партиями. Эти части, кроме того, существуют на рынке с жесткой конкуренц ей, из-за которой производительность растет, а цены падают. Вероятно, систем COW постепенно вытеснят ММР, подобно тому как персональные компьютер вытеснили большие вычислительные машины, которые применяются теперь тольк в специализированных областях.

Существует множество различных видов COW, но доминируют два из них: це трализованные и децентрализованные. Централизованные системы COW пре ставляют собой кластер рабочих станций или персональных компьютеров, смо тированных в большой блок в одной комнате. Иногда они компонуются бол компактно, чем обычно, чтобы сократить физические размеры идлинукабеля. Ка правило, эти машины гомогенны и не имеют никаких периферических устройст кроме сетевых карт и, возможно, дисков. Гордон Белл (Gordon Bell), разработчи PDP-11 и VAX, назвал такие машины «автономными рабочими станциями» (п скольку у них не было владельцев).

Децентрализованная система COW состоит из рабочих станций или персонал ных компьютеров, которые раскиданы по зданию или по территории учреждени Большинство из них простаивают много часов в день, особенно ночью. Обычн они связаны через локальную сеть. Они гетерогенны и имеют полный набор пер ферийных устройств. Самое важное, что многие компьютеры имеют своих вл дельцев.

Планирование

Возникает вопрос: чем отличается децентрализованная система COW от локально сети, соединяющей пользовательские машины? Отличие связано с программны обеспечением и не имеет никакого отношения к аппаратному обеспечению. В л

кальной сети пользователи работают с персональными машинами и использу

6 2 8 Глава 8. Архитектуры компьютеров параллельного действия

Рассмотрим самую простую модель планирования. Должно быть и сколько процессоров нужно для каждой работы (задачи). Тогда задачи иваются в порядке FIFO («первым вошел — первым вышел») (рис. 8.31, а первая задача начала выполняться, происходит проверка, есть ли достаточ личество процессоров для выполнения задачи, следующей по очереди. Ес она тоже начинает выполняться и т. д. Если нет, то система ждет, пока не п достаточное количество процессоров. В нашем примере система COW с 8 процессоров, но она вполне могла бы содержать 128 процессоров, расп ных в блоках по 16 процессоров (получилось бы 8 групп процессоров) или нибудь другой комбинации.

		Ipy ina процесс эров
		0 \| 1 2 3 \| 4 \| 5 6 7
	-	1
	-
Время	-		2
Время	III		:5
			:5
		4	5
		4
			I
\	-		8	9
		7

Группа процессоров

0 | 1 | 2 | 3 | 4 | 5 | 6 | 7

-	1	4
-

-3

-2

-	8
1 1 1 1 1

I руппа процес 0 1 I 2 3 | 4

- 1 4

-3

-8

- 9	2
I I I I I I
I

Рис. 8.31. Планированиеработы всистеме COW: FIFO(«первым вошел — первым выш безблокировкиначалаочереди(б);заполнениепрямоугольника«процессоры-вре

Серымцветомпоказанысвободныепроцессоры

В глубже разработанном алгоритме задачи, которые не соответствуют ству имеющихся в наличии процессоров, пропускаются и берется первая для которой процессоров достаточно. Всякий раз, когда завершается вып задачи, очередь из оставшихся задач проверяется в порядке «первым вошел вым вышел». Результат применения этого алгоритма изображен на рис. 8.

Еще более сложный алгоритм требует, чтобы было известно, сколько пр ров нужно для каждой задачи и сколько минут займет ее выполнение. Рас такой информацией, планировщик заданий может попытаться заполнить угольник «процессоры—время». Это особенно эффективно, когда задачи п лены на рассмотрение днем, а выполняться будут ночью. В этом случае пл

щик заданий получает всю информацию о задачах заранее и может выпол

Мультикомпьютеры с передачей сообщений

Ethernet и gigabit Ethernet. Они работают со скоростью 10,100 и 1000 Мбит/с (1, 12,5 и 125 Мбайт/с)1 соответственно. Все они совместимы относительно сред формата пакетов и протоколов2. Отличие только в производительности.

Каждый компьютер в сети Ethernet содержит микросхему Ethernet, обычно съемной плате. Изначально провод из платы вводился в середину толстого медн го кабеля, это называлось «зуб вампира». Позднее появились более тонкие кабе и Т-образные коннекторы. В любом случае платы Ethernet на всех машинах соед нены электрически, как будто они соединены пайкой. Схема подсоединения тр машин к сети Ethernet изображена на рис. 8.32, а.

							\
Процессор	Процессор		Процессор		1	1 1	1
				J		Плата	- С
				J			i:
				-\|	backplane
Пакет,			Пакет,
Пакет,			Пакет,		1	1 1	i
движущийся		движущийся			1	1 1	i
движущийся		движущийся
направо		налево		Канальная			Коммутатор
				карта		Ethernet

Рис. 8.32. Три компьютера в сети Ethernet (а); коммутатор Ethernet (б)

В соответствии с протоколом Ethernet, если машине нужно послать пакет, сн чала она должна проверить, не совершает ли передачу в данный момент кака либо другая машина. Если кабель свободен, то машина просто посылает пакет. Ес кабель занят, то машина ждет окончания передачи и только после этого посыла пакет. Если две машины начинают передачу пакета одновременно, происход конфликтная ситуация. Обе машины определяют, что произошла конфликтн ситуация, останавливают передачу, затем останавливаются на произвольный п риод времени и пробуют снова. Если конфликтная ситуация случается во втор раз, они снова останавливаются и снова начинают передачу пакетов, удваивая сре нее время ожидания с каждой последующей конфликтной ситуацией.

Дело в том, что «зубы вампира» легко ломаются, а определить неполадку в к беле очень трудно. По этой причине появилась новая разработка, в которой кабе из каждой машины подсоединяется к сетевому концентратору (хабу). По сущ

1 Соотнесение автором скоростных показателей упоминаемых технологий, выраженных отношени скорости передачи бит/с, с отношениями Мбайт/с неправомочно. Ни одна их этих технологий не зволяет передать по сети соответствующее количество байтов за секунду. Даже теоретически возмо ная скорость для стандарта Ethernet лежит в интервале 800-850 Кбайт/с. Дело в том, что для пере

6 3 0 Глава 8. Архитектуры компьютеров параллельного действия

ству, это то же самое, что и в первой разработке, но производить ремонт зд ще, поскольку кабели можно отсоединять от сетевого концентратора по пока поврежденный кабель не будет изолирован.

Третья разработка — Ethernet с использованием коммутаторов — пок рис. 8.32, б. Здесь сетевой концентратор заменен устройством, содержащи коскоростную плату backplane, к которой можно подсоединять канальны Каждая канальная карта принимает одну или несколько сетей Ethernet, и карты могут воспринимать разные скорости, поэтому classic, fast и gigabit могут быть связаны вместе.

Когда пакет поступает в канальную карту, он временно сохраняется там ре, пока канальная карта не отправит запрос и не получит доступ к плате ba которая функционирует почти как шина. Если пакет был перемещен в ка карту, к которой подсоединена целевая машина, он может направлятьс машине. Если каждая канальная карта содержит только один Etherne Ethernet имеет только одну машину, конфликтных ситуаций больше не нет, хотя пакет может быть потерян из-за переполнения буфера в канально Gigabit Ethernet с использованием коммутаторов с одной машиной на Et высокоскоростной платой backplane имеет потенциальную производительн крайней мере, это касается пропускной способности) в 4 раза меньше, чем связи в машине ТЗЕ, но стоит значительно дешевле.

Но при большом количестве канальных карт обычная плата backplane жет справляться с такой нагрузкой, поэтому необходимо подсоединить не машин к каждой сети Ethernet, вследствие чего опять возникнут конф ситуации. Однако с точки зрения соотношения цены и производительно на основе gigabit Ethernet с использованием коммутаторов — серьезный рент на компьютерном рынке.

Следующая технология связи, которую мы рассмотрим, — это ATM ronousTransferMode—асинхронныйрежимпередачи). ТехнологияAT разработана международным консорциумом телефонных компаний в кач мены существующей телефонной системы на новую, полностью цифров новная идея проекта состояла в том, чтобы каждый телефон и каждый ко в мире связать с помощью безошибочного цифрового битового канала со тью передачи данных 155 Мбит/с (позднее 622 Мбит/с). Но осуществит практике оказалось не так просто. Тем не менее многие компании сейчас в ют съемные платы для персональных компьютеров со скоростью передачи 155 Мбит/с или 622 Мбит/с. Вторая скорость, ОС-12, хорошо подходит д тикомпьютеров.

Провод или стекловолокно, отходящее от платы ATM, переходит в пер тель ATM — устройство, похожее на коммутатор Ethernet. В него тоже по пакеты и сохраняются в буфере в канальных картах, а затем поступают в щую канальную карту для передачи в пункт назначения. Однако у Etherne

Мультикомпьютеры с передачей сообщений

ный пункт. Нарис. 8.33. показаныдве виртуальные цепи. В сети Ethernet, напроти нет никаких виртуальных цепей. Поскольку установка виртуальной цепи занимае некоторое количество времени, каждая машина в мультикомпьютере должна уста навливать виртуальную цепь со всеми другими машинами при запуске и использо вать их при работе. Пакеты, отправленные по виртуальной цепи, всегда будут дос тавлены в правильном порядке, но буферы канальных карт могут переполнятьс как и в сети Ethernet с коммутаторами, поэтому доставка не гарантируется.

Процессор

| |

Ячейка

--. Г

]

Пакет

/ I

1 I

гг"Л

11 1 1

Порт

Виртуальная цепь

•-{

L_ J

Lj.4J

_9^

] --,

i|li

—i

I —

атоpATM

1f5

Рис.8.33. 16процессоров,связанныхчетырьмяпереключателямиATM. Пунктиром показаны две виртуальные цепи (канала)

Во-вторых, Ethernet может передавать целые пакеты (до 1500 байтов данных одним блоком. В ATM все пакеты разбиваются на ячейки по 53 байта. Пять и этих байтов — это поля заголовка, которые сообщают, какой виртуальной цеп принадлежит ячейка, что это за ячейка, каков ее приоритет, а также некоторы другие сведения. Полезная нагрузка составляет 48 байтов. Разбиение пакетов н ячейки и их компоновку в конце пути совершает аппаратное обеспечение.

Наш третий пример — сеть Myrinet — съемная плата, которая производитс одной калифорнийской компанией и пользуется популярностью у разработчико систем COW [18]. Здесь используется та же модель, что и в Ethernet и ATM, гд каждая съемная плата подсоединяется к коммутатору, а коммутаторы могут со

единяться в любой топологии. Каналы связи сети Myrinet дуплексные, они пере

6 3 2 Глава 8. Архитектуры компьютеров параллельного действия

Myrinet появилась со своей стандартной операционной системой, многие довательские группы уже разработали свои собственные операционные мы. У них появились дополнительные функции и повысилась производите (см., например, [17,107,155]). Из типичных особенностей можно назвать управление потоком, надежное широковещание и мультивещание, а также в ность запускать часть кода прикладной программы на плате.

Связное программное обеспечение для мультикомпьютеров

Для программирования мультикомпьютера требуется специальное прогр обеспечение (обычно это библиотеки), чтобы обеспечить связь между про и синхронизацию. В этом разделе мы расскажем о таком программном об нии. Отметим, что большинство этих программных пакетов работают в с МРРиCOW.

Всистемах с передачей сообщений два и более процессов работают неза друг от друга. Например, один из процессов может производить какие-ли ные, а другой или несколько других процессов могут потреблять их. Если вителя есть еще данные, нет никакой гарантии, что получатель (получател принять эти данные, поскольку каждый процесс запускает свою программ

Вбольшинстве систем с передачей сообщений имеется два примитив receive, но возможны и другие типы семантики. Ниже даны три основных ва

1.Синхронная передача сообщений.

2.Буферная передача сообщений.

3.Неблокируемая передача сообщений.

Синхронная передача сообщений. Если отправитель выполняет операц а получатель еще не выполнил операцию recei ve, то отправитель блокиру тех пор, пока получатель не выполнит операцию receive, а в это время соо копируется. Когда к отправителю возвращается управление, он уже знает, общение было отправлено и получено. Этот метод имеет простую семанти требует буферизации. Но у него есть большой недостаток: отправитель б ется до тех пор, пока получатель не примет и не подтвердит прием сообще

Буферная передача сообщений. Если сообщение отправляется до то получатель готов его принять, это сообщение временно сохраняется где-л пример в почтовом ящике, и хранится там, пока получатель не возьмет его При таком подходе отправитель может продолжать работу после операц даже если получатель в этот момент занят. Поскольку сообщение уже отпр отправитель может снова использовать буфер сообщений сразу же. Така сокращает время ожидания. Вообще говоря, как только система отправил

<<< < Предыдущая 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 6263 / 7063 64 65 66 67 68 69 70 > Следующая >>>

Соседние файлы в предмете Аппаратное обеспечение ЭВМ, средств телекоммуникаций и сетей

#
02.05.201412.96 Mб76Бибило П.Н. Основы языка VHDL.djvu
#
02.05.20145.59 Mб103Танненбаум Е. Архітектура компютера [pdf].pdf