
- •1.Факторы влияющие на производительность.
- •2.Иерархия RapidIo
- •3.Программное обеспечение параллельных компьютеров.
- •1. Эквивалентная схема заряда и разряда емкостей кристаллов микросхем. Зависимость потребляемой мощности микросхем от её параметров и параметров функционирования.
- •2. Формат пакета стандарта RapidIo, формат и типы транзакций.
- •3. Синхронизация асинхронных схем, временная диаграмма функционирования. Последствия отсутствия в схеме синхронизации асинхронных сигналов.
- •1)Системы с разделяемой памятью можно разбить на два класса:
- •1. Классификация микропроцессоров по Флинну
- •2. Основные характеристики стандарта pcIe.
- •3. Механизмы замещения в кэш памяти.
- •1. Мультитредовые микропроцессоры. Определение. Характеристики, преимущества и недостатки.
- •2. Протоколы лвс. Классификация лвс. Типы и методы доступа.
- •Ip (Internet Protocol), iPv6, Протокол tcp, Протокол udp
- •Иерархия кэш-памяти.
- •1. Vliw и epic процессоры. Достоинства и недостатки.
- •2. Основные типы топологий сети. Физическая и логическая топология сети.
- •3. Методы повышения надёжности памяти.
- •12.1 Решаемые задачи
- •12.2 Отличия локальных сетей от глобальных
- •Вопрос №16
- •Вычислительные кластеры
№1
1. Основные методы повышения производительности вычислительных систем.
2. Уровни иерархии стандарта RapidIO.
3. Клиент-серверный механизм взаимодействия в системах MPMD. Локальный и удалённый вызовы.
1.Факторы влияющие на производительность.
Имеются два фактора, ограничивающие производительность:
Надежность
Потребление питания
На производительность влияют такие факторы как:
Частота (чем больше частота, тем больше производительность)
Число выполненных инструкцией затрат.
Например, МОПС – миллионов операций в секунду для целочисленных значений
ФОПС - операции с плавающей запятой.
Целочисленные значения хуже параллелятся, но без них невозможно определить производительность.
Операции, которые выполняет сам микропроцессор
Выполнение определенных функций под выделенные задачи (телекоммуникационные, графические и т.д.)
2.Иерархия RapidIo
Прогресс в области компьютерной техники был обязан не только развитию микропроцессоров и оперативной памяти, но и методов передачи потока данных между ними. В последние годы увеличение разрядности и тактовой частоты в совокупности с уменьшением конструкции, давался все труднее и затратнее. В 2002 году компания Intel внедрила коммутационную структуру последовательного типа (КСПТ) PCI Express. RapidIO является одной из самых проработанных КСПТ и представляет собой технологию быстрого ввода\вывода.
Существует 3 уровня иерархии RapidIO
Физический (соответствует канальному + физическим уровням; 7 уровней модели ISO/OSI)
Транспортный соответствует сетевому уровню ISO/OSI
Сетевой уровень соответствует транспортному уровню ISO/OSI
Сетевой уровень: передача сообщений, передача I/O, глобальный раздел памяти
Транспортный уровень: организация пакетов
Физический уровень:
а) параллельный RIO, отдельный CLK [Предназначен для обмена внутри платы и между модулями; уже мало используется]
б) последовательный RIO, восстановляющийся CLK
3.Программное обеспечение параллельных компьютеров.
Система управления ресурсами вычислительных машин делится на переносимые и непереносимые.
Параллельные вычислители могут использовать 2 модели: SPMD и MPMD.
В модели MPMD реализуется клиент-серверный механизм.
Клиент – это процесс, вызывающий вычисления.
Сервер –это процесс реализации вычисления.
При локальном обмене программа передает параметры непосредственно в вычислительное устройство и получает результат через стэк или общую память.
При передачи параметров они запаковываются заглушкой клиента и извлекаются заглушкой сервера.
Передача в коммуникационную среду и передача от заглушки сервера к заглушке клиента, который рассматривает данные как параллельный возврат из процедуры.
В этом случае клиент и сервис независимы от коммуникационной среды.
№2
1. Основные ограничения повышения производительности микропроцессоров (МП).
2. Основные характеристики стандарта RapidIO.
3. Программное обеспечение параллельных компьютеров. Система управления ресурсами. Системы SPMD и MPMD.
Существует два основных фактора, ограничивающих производительность МП: низкая надёжность и высокая потребляемая мощность P. P~f*E^2, где f – тактовая частота, Е – напряжение питания. Рост тактовых частот ядра МП ограничен его тепловыделением. Надежность: с уменьшением проектных норм уменьшается напряжения питания, следовательно, необходимо повышать требования к качеству питания и уменьшать разброс порогов логических уровней. Так же уменьшаются толщины диэлектриков в интегральных схемах (как результат, повышаются токи утечки); снижаются величины паразитных зарядов; с увеличением количества элементов увеличивается вероятность сбоя микросхемы и т.д.
[Можно не писать, но желательно быть в курсе: RAPIDIO – коммутационная структура последовательного типа (КСПТ), т.е. система с внутренней сетью, соедин. обслуживаемые устройства так, чтобы передавать данные по сети с максимально возможной скоростью. Информация передается в виде пакетов данных, сигналов, сообщений и уведомлений. В заголовках пакетов и сообщений содержится информация для их идентификации, маршрутизации на внутренней сети, обработки в точке приема с обнаружением ошибок и повторной передачей для окончательного безошибочного приема. Передача может проводиться и в скоростном потоковом режиме, но без повторения в случае возникновения]
Характеристики:
- три уровня: сетевой (описывает систему ввода-вывода, передачу
пакетов/сообщений, глобальную память с разделением ресурсов, организацию и управление потоками данных; соответствует транспортному уровню ISO/OSI), транспортный (описывает общую организацию транспорта пакетов; соответствует сетевому уровню ISO/OSI) и физический (соответствует канальному и физическому уровню ISO/OSI; описывает параллельную (отдельный CLK) 8-/16-разрядную передачу пакетов данных, последовательную (восст. CLK) передачу 1х/4х (однополосную/четырехполосную) с использованием XAUI-совместимого электрического интерфейса, работающ. на частоте 1,25; 2,5; 3,125; 5; 6,25; 12,5 ГГЦ).
- возможны два типа систем, работающие на стандарте RIO: малые (до 256 устройств) и большие (до 64к устройств)
Основные требования к системе RapidIO:
· высокая производительность, обслуживание множества ОЭ(обрабатывающих элементов)/МП;
· наличие общей памяти, прямой доступ к памяти (канал ПДП) и возможность распределенной обработки;
· прямое одноранговое взаимодействие между элементами системы;
· поддержка различных операционных систем (ОС);
· поддержка различных топологий (с использованием механизмов анализа состояния маршрутов и организацией резервных путей);
· независимость передачи от ширины полосы и задержки физической структуры;
· возможность организации мультикастинга (передачи типа "точка-многоточка");
· высокая надежность (автоматический повтор передачи и синхронизация устройств, обработка ошибок на системном уровне);
· управление качеством обслуживания (QoS).
3. Параллельные вычислительные системы — это физические компьютерные, а также программные системы, реализующие тем или иным способом параллельную обработку данных на многих вычислительных узлах. ПО бывает нижнего уровня (как BIOS, набор команд, этот набор не носит временного характера, а находится в постоянной памяти компьютера) и верхнего(все остальные программы, языки программирования более сложные, программы верхнего уровень не могут работать без программ нижнего уровня), переносимое (ПО, которое будучи разработано и протестировано для одного компьютера, будет пригодно и для других компьтеров) и непереносимое. Любой уровень должен поддерживать средства отладки. Методы параллельного программирования: PVM(parallel virtual machine), MPI (Message Passing Interface). классификации схем функционирования параллельных компьютеров: SPMD (Single-Program, Multiple-Data — одна программа, несколько потоков данных) и MPMD (Multiple-Programs, Multiple-Data — множество программ, множество потоков данных) соответственно. Схема SPMD позволяет нескольким процессорам выполнять одну и ту же инструкцию или программу при условии, что каждый процессор получает доступ к различным данным. Схема MPMD позволяет работать нескольким процессорам, причем все они выполняют различные программы или инструкции и пользуются собственными данными. Таким образом, в одной схеме все процессоры выполняют одну и ту же программу или инструкцию, а в другой все процессоры выполняют различные программы или инструкции. В MPMD реализован клиент-серверный механизм (основной метод распределенного программирования). Клиент – процесс, вызывающий вычисления, сервер – процесс, реализующий вычисления. При локальном обмене программа передает параметры процедуры непосредственно в вычислительное устройство и получает результат через стэк или общую память. При передаче параметры запаковываются заглушкой клиента и извлекаются заглушкой сервера. Не уверена насчет этой фразы: Клиент и сервер независимы от коммуникационной среды, если при передаче от заглушки сервера к заглушке клиента, клиент рассматривает данные как нормальный возврат из процедуры.
Билет №3.
Методы снижения энергопотребления цифровых КМОП СБИС.
Пакеты и символы контроля стандарта Rapid IO. Последовательность формирования пакетов запроса и ответа.
Совмещение синхронизации асинхронного сигнала с условием его прохождения. Нарисовать принципиальную схему для условия ai x bi =12 (a, b – байты, разряды I = 1,2…8, х-операция И).
1. Методы снижения энергопотребления цифровых КМОП СБИС.
Причины высокого электропотребления:
а) Рассеивание энергии из-за токов утечки в статическом режиме.
б) Рассеивание энергии при протекании токов в динамическом режиме.
в) Энергия формирования логических состояний элементов.
Статическое потребление: определяется суммарными токами утечки транзисторов при отсутствии тактируемых сигналов. Этим можно пренебречь при нормах проектирования > 0.1 мкм. Снижение достигается за счёт создания специальной библиотеки на основе транзисторов с разными порогами переключения. При нормах проектирования 45 нм статическое потребление примерно равно динамическому потреблению.
Динамическое потребление: Р ~ C * V2 * f (P-мощность, С-ёмкость, V–напр. питания, f-частота)
1. ↓ V (пример: 65 нм. - 1-1.2 В). 2. ↓ С – использование SOI – КНИ. 3. ↓ f:
3.1 В конвейерных процессорах вставляются такты ожидания. Power DC – на кристалл ставятся термодатчики. Они фиксируют превышение t кристалла и происходит добавление 1 такта ожидания при обращении в кэш-память. ↓ быстродействие, ↓ и потребляемая мощность.
3.2 ↓ частоты блоков нефункционирующих на протяжении некоторого отрезка времени.
3.3 Использование разных частот для разных блоков.
4. «Пережимание» Сlock (gated clock – подход к построению схем с контролем за подачей тактового сигнала).
5. Средствами САПР:
-оптимизация расстановки -оптимизация нагрузки -отключение блоков
-оптимизация по входу -gated clock -создание более сложных элементов
-обратимая логика (исключает возможность изменения состояния)
- адиабатическая схема (запрет сквозных токов при переключении)
6. Самосинхронная схемотехника.
2. Пакеты и символы контроля стандарта Rapid IO. Последовательность формирования пакетов запроса и ответа.
Пакет запроса:
Предыдущий пакет |
S |
AckID |
rsrv |
^S |
rsrv |
Prio |
TT |
Ftype |
Адрес приёмника |
Адрес источника |
Транзакция |
Размер |
TID источника |
Devise offset Address |
Optional Data Payload |
CRC |
Следующий пакет |
Пакет ответа:
Предыдущий пакет |
S |
AckID |
rsrv |
^S |
rsrv |
Prio |
TT |
Ftype |
Адрес приёмника |
Адрес источника |
Транзакция |
Статус |
TID приёмника |
Optional Data Payload |
CRC |
Следующий пакет |
S – "0" – для пакетов запроса/отклика, "1" – для символов управления;
ackID – идентификатор подтверждения приема/квитирования пакета, посланный отправителю;
rsrv – резервное поле. prio – биты указателя приоритета. CRC – поля контроля ошибок (8 байтов).
ТТ и ftype – транспортный и логический заголовки пакета.
Управляющие символы – это элементы сообщений, используемых портами, связанными последовательным звеном, для управления всеми этапами его работы. С их помощью управляют звеном, сообщениями об ошибках, устанавливают границы пакетов и устраняют ошибки.
Формат полей заголовка управляющего символа:
S |
AckID |
rsrv |
^S |
rsrv |
Bus_status |
stype |
buf_status – 4 бита, определяющие число доступных пакетных буферов в принимающих устройствах;
s
type
– тип символа управления;
3.Совмещение синхронизации асинхронного сигнала с условием его прохождения. Нарисовать принципиальную схему для условия ai x bi =12 (a, b – байты, разряды I = 1,2…8, х-операция И).
Пояснения к рисунку: инверсия стоит на всех разрядах, кроме тех что должны быть 1 (3 и 4 биты).
Билет #4