Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книги / ПРОЕКТИРОВАНИЕ ПОВС (последнее).doc
Скачиваний:
77
Добавлен:
01.06.2015
Размер:
36.23 Mб
Скачать

Производительность суперкомпьютеров

Название

Год создания

Flop/s

Флоп

1941

100

Килофлоп

1949

103

Мегафлоп

1964

106

Гигафлоп

1987

109

Терафлоп

1997

1012

Петафлоп

2008

1015

Эксафлоп

1018

Зеттафлоп

1021

Йоттафлоп

1024

Ксерафлоп

1027

Среди ведущих учёных и специалистов, которые в настоящее время вносят существенный вклад в развитие высокопроизводительных вычислительных систем можно отметить:

- Калин С. В. – директор ИТМиВТ – проектирование и создание современных суперЭВМ и систем;

- Эйсымонт Л. К. – зам. главного конструктора суперкомпьютеров стратегического назначения (СКСН) «Ангара» ОАО «НИЦЭВТ»;

- Кима А. К. – генеральный директор ОАО «ИНУЭМ» – создание МВК «Эльбрус-3», в которой заложены знаменитые разработки ИТМиВТ «Эльбрус 1, 2»;

- Петричкович Я. Я. – директор ГУП «Элвис» - реализация принципа сквозного иерархического параллелизма в СБИС серии «Мультикор»;

- Научно-техническая школа научно-исследовательского института многопроцессорных вычислительных систем (НИИ МВС), кафедры вычислительной техники (ВТ) и других научно-учебных подразделений Таганрогского технологического института (ТТИ ЮФУ) – разработка и создание МВС с динамически реконфигурируемой (перестраиваемой, программируемой) архитектурой на основе ПЛИС и их математического обеспечения с использованием Языков высокого уровня.

С 1966 года в Таганрогском государственном радиотехническом университете (ТРТУ) под руководством профессора А.В. Каляева получило серьезное развитие одно из направлений в рамках общей теории вычислительных систем с программируемой архитектурой – теория однородных цифровых интегрирующих структур (ОЦИС) и однородных вычислительных структур (ОВС) [36, 77, 85, 86].

Предложена идея построения микропроцессоров ОВС с программируемой (перестраиваемой) структурой, коммутацией и процессом, которые настраиваются на выполнение ограниченного набора крупных операций, а не на большое число мелких элементарных команд, как это делается в классических микропроцессорах. Такой подход к синтезу микропроцессоров и построению на их основе ОВС позволяет приблизить язык микропроцессоров к внешнему языку высокого уровня, увеличить скорость выполнения операций в микропроцессоре, облегчить распределение задач между параллельно работающими микропроцессорами в мультипроцессорной ОВС.

Начиная с 1972 года, профессором В.Ф. Гузиком совместно с сотрудниками кафедры вычислительной техники Таганрогского государственного радиотехнического университета развивается идея макроблочных ОЦИС с точки зрения построения модульных ОЦИС, в которых архитектурной единицей становятся функциональные модули (ФМ) – специализированные микропроцессоры (СМП), состоящие из определенного количества универсальных решающих блоков (УРБ) ОЦИС, коммутируемых между собой по функциональным признакам и реализующих базисные операторы, а математическое обеспечение строится на универсальном уровне отображения задач в модульную ОЦИС с помощью интерпретирующих или компилирующих трансляторов [14, 24, 25, 28 − 37, 39, 88]. Такого рода ОЦИС, являясь специализированными однородными вычислительными структурами, названы интегрирующими вычислительными структурами (ИВС).

В основу функционирования модульных ИВС положен тот же принцип представления информации (в виде приращений) и тот же способ ее переработки (численное интегрирование систем дифференциальных уравнений Шеннона), как и в ОЦИС. Поэтому с этой точки зрения модульные ИВС являются специализированным в отношении классов решаемых задач вычислительным устройством.

Интегрирующая вычислительная структура – это автомат с программируемой структурой, представляющий собой коммутируемую совокупность микропроцессоров, характеризующихся: специальным способом переработки информации; изменяемостью внутренней конфигурации; глобальностью распараллеливания вычислительного процесса; возможностью наращивания вычислительной мощности под воздействием базовой машины ИВС [1], которая объединяет в себе обрабатывающие и управляющие программы; конструктивно-технологической выполняемостью на больших интегральных схемах.

По мнению многих специалистов, будущие вычислительные машины и суперЭВМ должны быть модульными, расширяемыми и перестраиваемыми [36, 86, 96]. Модульность и перестраиваемость упрощают проектирование и создание систем и позволяют адаптировать систему к структурам решаемых задач, ресурсным возможностям и специфики областей применения.

Несмотря на то, что, как в нашей стране, так и за рубежом, достаточно широкое распространение получили цифровые специализированные вычислительные устройства, в настоящее время нельзя считать решенной задачу создания общей теории специализированных вычислительных структур, которая позволила бы разработчикам синтезировать на ее основе с минимальными затратами системы с требуемыми характеристиками с учетом специальных требований, определяемых условиями практического использования. Поэтому разработка вопросов общей теории организации структур и вычислительных процессов цифровых специализированных вычислительных систем на сегодняшний день является актуальной и требует серьёзного решения [36, 39, 40, 44, 46, 86].

В последние годы в цифровой вычислительной технике наибольшее развитие получили персональные компьютеры и проблемно – ориентированные системы. Как в первом и особенно во втором случае при проектировании вычислительных систем основное внимание уделяется достижению их максимальной производительности. Среди методов обработки данных наиболее высокопроизводительными считаются методы, которые ориентированы на параллельно-конвейерное выполнение вычислительных операций. В настоящее время разработаны и выпускаются несколько типов программируемых логических матриц, позволяющих создать параллельно-конвейерные вычислители. Задачей проектирования является выбор элементной базы и определение перечня базовых операций, реализация которых целесообразна на ПЛИС.

Процесс проектирования вычислительной части проблемно-ориентированной системы (ПОВС) включает следующие этапы.

На этапе постановки задачи определяется проблемная ориентация системы. Для этого рассматривается весь набор задач, подлежащий обработке, и выбирается круг наиболее близких по алгоритмической реализации задач. Рассматриваемый шаг необходим для ограничения круга базовых операций, которые реализуются аппаратно в ПЛИС или в системе.

При решении этих вопросов необходимо учитывать специфику конкретной области применения создаваемой системы. Основным критерием при выборе тех или иных решений является уровень производительности, который достигается системой обработки либо отдельным ее блоком, реализованным на основе заданной технологии.

Рассмотрим с этих позиций некоторые, наиболее характерные области применения методов цифровой обработки сигналов.

Обработка звуковых сигналов включает анализ, распознавание и синтез речи, телекоммуникацию, сжатие данных при их передаче по каналам связи. В большинстве случаев удовлетворительные результаты обеспечивает формат данных с фиксированной запятой и длиной слова 16 бит. При повышенных требованиях к качеству обработки возможен переход к 32-разрядному формату с плавающей запятой. Диапазон частот входных сигналов для задач обработки речи составляет 100 Гц – 4 кГц, поэтому частота дискретизации во многих случаях выбирается порядка 8 кГц. При обработке и передаче звуковых сигналов вообще, в том числе музыки, верхняя граница диапазона частот расширяется до 20 – 40 кГц. Частота дискретизации достигает в таких случаях 112 кГц и более. Используемые алгоритмы включают цифровую фильтрацию, спектральный анализ сигналов (вычисление дискретного (ДПФ) или быстрого (БПФ) преобразований Фурье), корреляционный анализ, обратную свертку, а также специальные алгоритмы типа линейного предсказания, динамического программирования для задач распознавания и т. д. Если реализуются блочные алгоритмы обработки данных, то размер блоков составляет от 128 до 256 выборок. Требуемая производительность в задачах обработки звуковых сигналов может достигать 6105 – 6106 умн./с.

Целями обработки изображений являются улучшение изображений, содержащих шумы, сжатие информации для передачи и хранения, распознавание образцов. Восстановление и улучшение изображений осуществляются фильтрацией с помощью инверсной свертки. Поскольку размеры обрабатываемых данных в этом случае достаточно велики (типовые значения 256х256 отсчетов и 512x512 отсчетов), то для решения задач линейной фильтрации изображений широко используются алгоритмы БПФ. При обработке изображений алгоритмы фильтрации, вычисления свертки и БПФ являются двумерными. Важный класс задач, связанных с восстановлением и улучшением изображений, возникает при анализе объектов различной природы методами проникающего излучения. Восстановление трехмерной структуры объекта по его проекциям осуществляется путем вычисления преобразований Фурье от проекций, формирования набора сечений объекта и вычисления обратного преобразования Фурье. Для улучшения качества таких изображений применяются методы пространственно - частотной фильтрации. Другой класс алгоритмов улучшения изображения образуют точечные операции, в том числе преобразование контрастности, выделение контуров, методы статистической обработки изображений.

Для сжатия информации при передаче и хранении изображений используются различного рода преобразования. Наиболее эффективным в статистическом смысле является преобразование Карунена-Лоэва, однако оно требует больших объемов вычислительных операций и не имеет быстрых алгоритмов выполнения. В отличие от преобразования Карунена-Лоэва ортогональные преобразования типа преобразования Фурье, Адамара, Уолша допускают быструю реализацию и обеспечивают достаточно эффективное сжатие исходных изображений, что является причиной их широкого распространения для решения таких задач.

Задачи распознавания образов для обработки изображений решаются теми же способами, что и для распознавания речи, однако объемы массивов данных при этом значительно возрастают и достигают 105 – 106 отсчетов. Разрядность данных, как правило, невелика и составляет 4 – 8 бит. Требуемая производительность оценивается цифрами 109 – 1012 оп./с.

Системы радиолокации выполняют поиск и обнаружение объектов в пространстве, определение координат и динамических параметров этих объектов и их классификацию. На основе полученных данных осуществляется принятие решения и управление соответствующими комплексами. Основным содержанием обработки данных в радиолокационной системе (РЛС) является согласованная фильтрация сигналов, поступающих от датчика-антенны. Диапазон частот входных сигналов составляет 10 МГц – 10 ГГц. Во многих случаях фильтрация осуществляется в частотной области на основе алгоритмов БПФ. Размеры преобразований могут достигать 214 комплексных точек, однако существуют задачи, в которых массивы данных имеют умеренные размеры: 1024, 512 и менее точек. В системах с фазированной антенной решеткой (ФАР) для формирования диаграммы направленности используется макрооперация скалярного произведения векторов (иногда называемая весовым суммированием). Разрядность входных данных в настоящее время составляет 6 – 8 бит, однако существует тенденция к ее увеличению до 10 – 12 бит и более. Требования по быстродействию оцениваются цифрами порядка 108 – 1010 умн./с.

Задачи гидролокации включают в основном те же операции, что и задачи радиолокации, т. е. формирование диаграммы направленности, спектральный анализ, корреляционный анализ и свертку, вторичную обработку сигналов для вывода информации на устройства отображения и решения задач управления. Соответственно используются такие алгоритмы, как скалярное произведение вещественных и комплексных векторов, одномерные прямые БПФ и обратные БПФ, двумерные (пространственно-временные) БПФ, вычисление корреляционных функций, одномерная и двумерная свертки и матричные операции, включая умножение матриц, обращение матриц и решение систем линейных уравнений. Особенностью гидроакустических сигналов является их более низкочастотной диапазон (2 – 40 кГц). С другой стороны, высокая зашумленность этих сигналов требует построения многоканальных систем с автоматической регулировкой усиления (АРУ), поэтому в современных гидролокационных системах объем вычислительных операций имеет такой же порядок, как и в РЛС (106 – 108 оп./с). Анализ изложенных выше требований по функциональным возможностям аппаратуры ЦОС, форматам данных, производительности позволяет выделить следующие основные моменты, которые встречаются часто и реализация которых представляется необходимой на первом этапе работ.

Используемые алгоритмы: фильтрация, вычисление свертки, БПФ. Форматы данных: 8 и 16 бит с фиксированной запятой. Производительность 108 – 1010 оп./с типа сложение – умножение.

После выбора круга задач, определяющих проблемную ориентацию системы, переходят к формирования технических требований к системе, другими словами – к формулировке технического задания на систему. В техническом задании задаются предельные тактико-технические характеристики системы. Эти характеристики системы являются рамочными, и это есть следствие компромисса между "желаемым" и "возможным". И он достигается в ходе дискуссии между заказчиком и исполнителем. Заказчик формулирует пожелания и требования к системе, особенностям ее организации, платит за изделие и принимает его. Исполнитель оценивает исходные данные, обосновывает возможность их воплощения и необходимые затраты на разработку и воплощение.

Когда компромисс найден и техническое задание сформулировано, приступают к этапу проектирования – этапу выбора методов решения задачи.

Использование методов цифровой обработки сигналов позволяет относительно легко обеспечить высокую помехоустойчивость систем обработки данных, необходимую точность и разрешающую способность, простое сопряжение подсистемы обработки сигналов с управляющей машиной, стабильность параметров тракта обработки данных и ряд других преимуществ. Поэтому за последние 20 – 25 лет процессоры ЦОС в том или ином виде стали неотъемлемой составной частью вычислительных комплексов, предназначенных для научных исследований или решения задач управления.

В книге [62] представлены результаты разработки специализированной элементной базы для параллельно-конвейерных систем, которая позволяет практически решать вопросы эффективной реализации систем такого типа с приемлемыми параметрами по габаритным размерам и потребляемой мощности.

В дальнейшем при описании процесса проектирования конкретных проблемно-ориентированных систем перечисленные этапы проектирования будут рассмотрены подробно.