- •Оглавление
- •1. Количественные характеристики, используемые при измерении параметров вычислительных систем. Номинальное и пиковое быстродействие. Быстродействие вычислителя по гибсону.
- •2. Понятие о современных вычислительных системах. Диаметр. Средний диаметр.
- •3. Наиболее популярные схемы вычислительных систем: «общая шина», «линейка», «кольцо», «тор», «решетка».
- •4. Структура вычислительных систем типа двумерный тор, n-мерный двоичный гиперкуб.
- •5. Реализация обмена информацией в структуре типа «обобщенный nd-куб» и «nd-тор»
- •6. Структура вычислительных систем типа циркулянта и типа л(n,n,g) - граф.
- •7. Структура вычислительных систем типа «бинарное дерево», «мультидерево глубины n и ширины k».
- •8. Характеристика коммутаторов вычислительных систем.
- •9. Архитектурные свойства вычислительной сети и описание процессов её функционирования.
- •10. Надежность и живучесть вычислительной системы.
- •11А. Схемы обмена информацией между ветвями параллельных алгоритмов.
- •12. Структурные характеристики вычислительных систем.
- •13. Пример решения задачи умножения матриц с помощью вычислительных систем.
- •14. Показатели эффективности параллельных алгоритмов. Коэффициент накладных расходов, коэффициент ускорения. Понятие о сложных задачах.
- •Коэффициент ускорения
- •Понятие о сложных задачах
- •15. Закон амдаля и коэффициент эффективности параллельной программы.
- •16А. Понятие о сложных задачах
- •17. Принципы перехода от последовательного алгоритма к параллельному. Алгоритм преобразования последовательного алгоритма в параллельный.
- •18. Представление алгоритмов взвешенными графами. Свёртка и развёртка вершин графа. Основные определения матриц следования информационного графа. Алгоритмы их получения.
- •19. Треугольная матрица следования. Теорема об условиях её получения.
- •20. Матрица следования для информационно-логического графа. Алгоритм построения транзитивных связей в этой матрице.
- •21. Обоснование транзитивных операций дизъюнкции и конъюнкции.
- •22. Алгоритм определения наличия контуров в информационной граф-схеме алгоритма.
- •23. Понятие о матрице логической несовместимости. Внешние и внутренние замыкания в информационно-логическом графе.
- •24. Алгоритм построения матрицы логической несовместимости операторов.
- •25. Понятие о матрице независимости в граф-схемах алгоритмов.
- •26. Взаимно независимые операторы. Определение взаимной независимости. Полные и максимально полные множества взаимно независимых операторов.
- •27. Алгоритм нахождения полных множеств взаимно независимых операторов.
- •28. Алгоритмы построения ранних и поздних сроков окончания выполнения операторов.
- •29. Определение функции плотности загрузки и минимальной загрузки для вычислительных систем.
- •30. Алгоритм определения минимальной загрузки в вычислительной системе на заданном интервале.
- •31. Лемма об оценке максимально необходимого числа процессоров для решения поставленной задачи.
- •32. Утверждение об оценке минимально необходимого числа процессоров для решения поставленной задачи.
- •33. Об оценке снизу времени выполнения задачи при заданном количестве процессоров.
- •34. Уточнение оценки снизу времени выполнения задачи на n процессорах.
- •35. Алгоритм определения оценки минимального числа процессоров, необходимых для выполнения алгоритма за время t.
- •36. Алгоритм определения оценки минимального времени t выполнения заданного алгоритма на вычислительной системе, содержащей n процессоров.
- •37. Алгоритм оценки минимально необходимого количества процессоров для задачи, представленной информационно-логическим графом.
- •38. Алгоритм оценки времени выполнения задачи, представленной данным вычислительных систем графом.
- •39. Архитектурные аспекты при создании операционной системы вычислительных сетей.
- •40. Опыт применения методики крупноблочного распараллеливания сложных задач.
- •41. Основы функционирования вычислительной системы типа «микрос-т».
- •42. Исследование информационных графов с векторными весами вершин для планирования параллельных вычислений.
- •43. Алгоритм нахождения операторов входящих только в одно множество взаимно независимых операторов.
- •46. Определение плотности загрузки для I-го типа процессора и алгоритм ей вычисления.
- •51. Коммуникационная среда на основе масштабируемого когерентного интерфейcа sci.
- •52. Коммуникационная среда на основе технологии myrinet.
- •53. Краткая характеристика коммуникационной среды qsnet II.
- •54. Алгоритм распределения нитей граф-схемы алгоритма по узлам вычислительной сети.
- •55. Представление алгоритмов взвешенными графами. Основные определения матрицы описания информационного графа. Алгоритмы ее получения.
- •56. Изображение схем параллельных алгоритмов с помощью информационных (иг) и информационно-логических (илг) графов.
- •Вычисление матриц следования, расширенных матриц следования и матриц следования с транзитивными связями.
1. Количественные характеристики, используемые при измерении параметров вычислительных систем. Номинальное и пиковое быстродействие. Быстродействие вычислителя по гибсону.
Наименование параметра |
Единицы измерения и соотношения между ними |
Примечания |
|
1МГц=106 Гц 1ГГц=103МГц=109Гц |
Определение быстродействия вычислителя. |
|
1 MIPS (Million Instructions Per Second)=106 оп/сек. 1GIPS=109 оп/сек. |
Номинальное быстродействие процессора (быстродействие по Гибсону) |
|
1 FLOPS(Floating point Operations Per Second) 1MFLOPS=106 FLOPS; 1GFLOPS=109 FLOPS; 1TFLOPS=1012 FLOPS; 1PFLOPS=1015 FLOPS; |
Быстродействие, получено на специальных тестовых наборах. |
|
1Kbit=210 bit; 1Kbyte=210 byte; 1Mbit=220 bit;1Mbyte=220 byte; 1Gbit=230 bit; 1Gbyte=230 byte; 1Tbit=240 bit; 1Tbyte=240 byte; 1Pbit=250 bit; 1Pbyte=250 byte; |
Верхняя оценка параметров современных ВС: 100 FLOPS (быстродействие) 1000 Gbyte (память) 1000 мбод (пропускная способность) |
Различают следующие разновидности характеристик быстродействия:
1. Номинальное (максимальное, пиковое) быстродействие:
Здесь n - число процессоров или АЛУ; k - число различных команд в списке команд ЭВМ; γi - удельный вес команд i-го типа в программе, ti - время выполнения команды типа i. Если ti задавать в тактах, то выражение будет определять архитектурную скорость, измеряемую числом команд, выполняемых за один такт. Этот параметр особенно важен для суперскалярных процессоров. Веса команд определяют путем сбора статистики по частотам команд в реальных программах. Известны смеси команд Гибсона, Флинна и ряд других.
Для микропроцессоров с сокращенной системой команд, в которых большинство команд выполняется за один такт, вычисление Vн упрощается: Vн = n/t = n/f, где f - частота синхронизации микропроцессора, а n - число одновременно выполняемых команд (для суперскалярных микропроцессоров).
Очевидно, что номинальное быстродействие определяет только свойства оборудования, причем, в предположении, что оно полностью загружено в каждом такте, что, конечно, далеко от действительности.
2. Реальное быстродействие ЭВМ Vp определяется с учетом всех факторов, сопутствующих выполнению пользовательских программ. Наилучшим способом определения Vp было бы выполнение реальных пользовательских задач и измерение времени их выполнения, тогда можно было бы считать, что:
где k - число выполненных задач; zi - число выполненных в i-й задаче команд; Tk - время решения k задач. Реальное быстродействие обычно в 5-10 раз меньше номинального.
2. Понятие о современных вычислительных системах. Диаметр. Средний диаметр.
*Вычислитель – элементарный процессор, стоящий в узле ВС. Структуру ВС будем представлять в виде неориентированного графа, где вершины – вычислители, а ребра – связи между ними.
Система, представленная совокупностью описаний W=<K, A>, где
K – описание конструкции ВС,
А – описание алгоритма работы коллектива вычислителей,
называется вычислительной, если:
Описание К составляет множество значений {M, S}, где М – множество вычислителей (M={mi}, i=0, …, N-1), а S – тип связей между вычислителями.
В конструкцию K закладываются следующие принципы:
Параллелизм при обработке информации, т.е. организация вычислений одновременно на множестве вычислителей М и обеспечение, в случае необходимости, обмена данными через сеть.
Адаптация конфигурации сети S к решаемой задаче.
