Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Тюменский Государственный Университет

Предмет:

Языки программирования

Файл:

Параллельное программирование (лекции) / lec01.pptx

Скачиваний:

Добавлен:

19.04.2015

Размер:

1.12 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 33

Проблемы UMA

Доступ с разных процессоров к общим данным

Необходимо обеспечивать однозначность (когерентность) содержимого разных кэшей

(cache coherence problem).

Решение:

уведомление всех процессорных узлов (и кэшей!) об изменении значения в общей памяти

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

26	Копии значения переменной x – в разных кэшах
	Возможно изменение х одним из процессоров.

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

Проблемы UMA

27	Доступ с разных процессоров к общим данным
	Доступ с разных процессоров к общим данным
	Необходимость синхронизации взаимодействия
	одновременно выполняемых потоков команд
	(многопоточность)

Методы синхронизации:

Мьютекс (mutual exclusion,

взаимоисключение)

Семафор

События

…

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

28	Мультипроцессоры –
	способы построения общей памяти

2.Физически распределенная общая память с неравноправным (неоднородным) доступом

(Non-Uniform Memory Access, NUMA).

Принцип:

Блок памяти ↔ процессор (быстрый доступ)

«Чужие» блоки ↔ процессор (медленный доступ – до нескольких порядков) – ОСНОВНАЯ ПРОБЛЕМА!

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

29	Архитектура систем NUMA

АЛГОРИТМЫ И

NUMA системы

Для данных используются только локальные кэши процессоров – нет общей памяти => нет проблемы когерентности

(COMA-системы, Cache-Only Memory

Architecture)

Обеспечена когерентность локальных кэшей

(аппаратно)

(СС-NUMA-системы, Cache-Coherent)

Не обеспечена когерентность локальных кэшей

(NСС-NUMA-системы, Non-Cache-Coherent)

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

31 Мультикомпьютеры

МК – ВС с распределенной памятью самостоятельных компьютеров, объединенных в сеть

МК – системы типа NORMA

(No-Remote Memory Access – «нет доступа к удаленной памяти»)

Архитектура аналогична архитектуре МП с распределенной памятью.

НО!:

Каждый процессор может использовать только свою локальную память.

Для доступа к «чужим» данных д.б. явно выполнены операции

передачи сообщений (message passing operations) – 1- или 2-сторонний обмен данными

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

32	Основные типы МК – многопроцессорных
	вычислительных систем

Массивно (массово)-параллельные системы, MPP-системы (Massively Parallel Processing – массово-параллельная обработка)

Система состоит из однородных узлов (до 103), включающих:

один или несколько ЦП (обычно RISC),

локальную память (прямой доступ к памяти других узлов невозможен!),

коммуникационный процессор или сетевой адаптер

жесткие диски и/или другие устройства I/O

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

33	Основные типы МК – многопроцессорных
	вычислительных систем

Кластер - набор рабочих станций (или даже ПК) общего назначения, используется в качестве дешевого варианта МРР- системы.

Связь узлов - одна из стандартных сетевых технологий (Fast/Gigabit Ethernet, Myrinet и др.) на базе шинной архитектуры или коммутатора.

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

34	Классификация многопроцессорных ВС
	(подробно см. http://parallel.ru/computers/classes.html)

35	Коммуникация в МВС

Коммуникация между процессорами обеспечивает:

взаимодействие, синхронизацию, взаимоисключения выполняемых процессов

Коммуникационная «трудоемкость» алгоритма влияет на выбор способа решения задачи

Коммуникация определяется топологией сети –

схемой расположения и соединения сетевых устройств.

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

36	Примеры топологий сетей в МВС

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

37	Особенности топологий сетей
	передачи данных

Тип - Преимущества - Реализация

Полный граф – минимум затрат на передачу данных - -

(кластер с соединением CPU через свитч с ограничением:

только одна одномоментная операция приема-передачи данных для каждого процессора взаимодействующие пары CPU не должны пересекаться).

Линейка – идеально для конвейерных вычислений - +

Кольцо - ? - +

Звезда – для централизованных схем вычислений - +

Решетка (2D, 3D) - + - +

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

38	Характеристики топологий сети

Диаметр – определяет время передачи данных через max расстояние между 2 CPU сети

(расстояние равно величине кратчайшего пути).

Связность – определяет наличие разных маршрутов передачи данных между CPU,

min число дуг графа, которые надо удалить для получения 2 несвязных областей.

Ширина бисекции – связность, но 2 области д.б. одинакового размера

Стоимость – общее число линий передачи данных в МВС

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

39	Характеристики топологий
	(р – количество процессоров)
	Топология Диаметр Ширина	Связност Стоимость
	бисекции	ь

Граф	1	р2/4	р - 1	р(р - 1)/2
Звезда	2	1	1	р - 1
Линейка	р - 1	1	1	р - 1
Кольцо	р/2	2	2	р
Решетка	2(√р - 1)	√р	2	2(р - √р)
(2D)

АЛГОРИТМЫ И ТЕХНОЛОГИИ РАЗРАБОТКИ ПАРАЛЛЕЛЬНЫХ ПРОГРАММ. ЛЕКЦИЯ 1

<<< < Предыдущая 1 23 / 33

Соседние файлы в папке Параллельное программирование (лекции)

#
19.04.20153.61 Кб34gauss_omp.c
#
19.04.2015680.99 Кб35lec01.pdf
#
19.04.20151.12 Mб41lec01.pptx
#
19.04.2015677.27 Кб40lec02.pptx
#
19.04.20151.43 Mб52lec03.pptx
#
19.04.2015969.61 Кб39lec04.pptx
#
19.04.2015347.39 Кб36lec05.pptx
#
19.04.20151.35 Mб45lec06.pptx