
- •В.Ф. Гузик проектирование проблемно - ориентированных вычислительных систем
- •Часть 1
- •Предисловие
- •Производительность суперкомпьютеров
- •Почему в России не построили одну из самых мощных эвм в мире Компьютер завис
- •Упакованные узлы
- •Да здравствует вчерашний день
- •450 Миллионов рублей потрачено рф на создание суперкомпьютера «скиф»
- •Суперкомпьютеры помогут подтянуть экономику
- •Просто супер! «скиф» ведет в счете: суперкомпьютерный центр открылся в Белгосуниверситете
- •Подводный странник
- •Россия на пороге квантовой революции
- •Строим сами России по плечу создание национальной киберинфраструктуры
- •Вперед - за облаками! Программа "Университетский кластер" выходит на новый этап развития
- •Квантовый компьютер...
- •Глава первая. Концепция построения многопроцессорных вычислительных систем с программируемой архитектурой (мвс па)
- •Глава вторая. Организация математического обеспечения мвс с программируемой архитектурой
- •2.1. Основы математического обеспечения многопроцессорных вычислительных систем с программируемой архитектурой
- •2.2. Организация машинных языков высокого уровня и технология программирования мвс с программируемой архитектурой
- •2.3. Организация параллельных вычислительных процессов в мвс с программируемой архитектурой
- •Глава третья. Проблемно-ориентированные мвс па
- •3.1.Методика перехода от систем дифференциальных и алгебраических уравнений к системе уравнений Шеннона
- •3.1.1.Представление исходной задачи в форме, удобной для реализации на цифровых интегрирующих машинах (цим)
- •3.1.2. Методика перехода от заданных функций к системе уравнений Шеннона
- •3.1.3. Методика перехода от заданных дифференциальных уравнений к системе уравнений Шеннона
- •3.1.4.Методика перехода от систем линейных алгебраических уравнений к системе уравнений Шеннона
- •3.1.5.Получение программных матриц соединений цифровых решающих модулей
- •3.1.6.Методика перехода от программных матриц к схеме соединения цифровых решающих модулей (црм) в цим с жесткими связями
- •3.2.Примеры структурной организации вычислительного процесса в цим.
- •3.2.1.Задача №1
- •3.2.2.Задача №2
- •3.2.3.Задача №3
- •Приложение 3.2
- •3.2.4.Задача №4
- •3.2.5.Задача №5
- •Глава четвёртая. Теоретические основы построения интегрируЮщих вычислительных структур модульного типа
- •4.1. Общая структурно-логическая схема проектирования (анализа и синтеза) модульных ивс
- •4.2. Представление задач для модульных ивс в операторном пространстве
- •4.3. Построение базиса в операторном -пространстве для ивс модульного типа
- •4.4. Разработка эффективного машинного алгоритма выбора базиса в операторном -пространстве
- •4.5. Математическая модель ивс модульного типа на основе t -алгоритмов
- •4.6. Примеры, иллюстрирующие работу базовой машины ивс
- •Глава пятая. Анализ и синтез универсальных решающих блоков интегрирующих вычислительных структур (ивс)
- •5.1. Синтез алгоритма универсального решающего блока интегрирующих вычислительных структур
- •5.2. Разработка алгоритма автоматического масштабирования переменных и приращений в универсальном решающем блока ивс
- •5.3. Построение структурных схем универсальных решающих блоков ивс с автоматическим масштабированием переменных
- •5.4 Разработка алгоритма универсального решающего блока, основанного на принципе цифрового слежения и синтез его структурной схемы
- •5.5.Проектирование решающей части интегрирующих вычислительных структур
- •Глава шестая. Проектирование функциональных модулей интегрирующих вычислительных структур
- •6.1. Исследование принципов построения коммутационных систем модульных интегрирующих вычислительных структур
- •6.2. Разработка волновых каскадных коммутирующих сред для интегрирующих вычислительных структур
- •6.3. Принципы построения цифровых решающих и функциональных модулей ивс
- •6.4.Определение параметров функциональных модулей интегрирующих вычислительных структур
- •6.5.Матричное представление функциональных модулей интегрирующих вычислительных структур
- •6.6. Построение специализированного микропроцессора интегрирующей вычислительной структуры
- •Глава седьмая. Система математического обеспечения модульных интегрирующих вычислительных структур
- •7.1. Структура системы математического обеспечения модульных ивс
- •7.2. Разработка языка структурного программирования высокого уровня для модульных ивс
- •7.3.Разработка транслятора, загрузчика и диспетчера системы программного обеспечения модульных ивс
- •7.4. Построение пакета системных программ для программного обеспечения ивс
- •7.5. Организация вычислительных процессов в модульных ивс
- •Глава восьмая. Однородные цифровые интегрирующие структуры
- •8.1. Цифровые интеграторы для оцис
- •8.2. Интерполяционные и экстраполяционные, одноразрядные и многоразрядные однородные цифровые интегрирующие структуры
- •Глава девятая. Примеры проектирования проблемно- ориентированных мвс на интегрирующих структурах
- •9.1. Моделирующий вычислительный комплекс для исследования систем инерциальной навигации на основе модульных ивс
- •9.2. Применение интегрирующих вычислительных структур для реализации систем управления манипуляционными устройствами автономных роботов
- •9.3. Специализированная вычислительная система для решения задач управления с прогнозированием
- •9.4. Логико-интегрирующие вычислительные структуры
- •Приложение 1 Примерный перечень
- •Министерство образования и науки российской федерации
- •Курс «Технология программирования»
- •Практические задания
- •Курс «Интерфейсы периферийных устройств»
- •Курс «Конструкторско-технологическое обеспечение производства эвм»
- •Библиографический список
- •Оглавление
Производительность суперкомпьютеров
Название |
Год создания |
Flop/s |
Флоп |
1941 |
100 |
Килофлоп |
1949 |
103 |
Мегафлоп |
1964 |
106 |
Гигафлоп |
1987 |
109 |
Терафлоп |
1997 |
1012 |
Петафлоп |
2008 |
1015 |
Эксафлоп |
|
1018 |
Зеттафлоп |
|
1021 |
Йоттафлоп |
|
1024 |
Ксерафлоп |
|
1027 |
Среди ведущих учёных и специалистов, которые в настоящее время вносят существенный вклад в развитие высокопроизводительных вычислительных систем можно отметить:
- Калин С. В. – директор ИТМиВТ – проектирование и создание современных суперЭВМ и систем;
- Эйсымонт Л. К. – зам. главного конструктора суперкомпьютеров стратегического назначения (СКСН) «Ангара» ОАО «НИЦЭВТ»;
- Кима А. К. – генеральный директор ОАО «ИНУЭМ» – создание МВК «Эльбрус-3», в которой заложены знаменитые разработки ИТМиВТ «Эльбрус 1, 2»;
- Петричкович Я. Я. – директор ГУП «Элвис» - реализация принципа сквозного иерархического параллелизма в СБИС серии «Мультикор»;
- Научно-техническая школа научно-исследовательского института многопроцессорных вычислительных систем (НИИ МВС), кафедры вычислительной техники (ВТ) и других научно-учебных подразделений Таганрогского технологического института (ТТИ ЮФУ) – разработка и создание МВС с динамически реконфигурируемой (перестраиваемой, программируемой) архитектурой на основе ПЛИС и их математического обеспечения с использованием Языков высокого уровня.
С 1966 года в Таганрогском государственном радиотехническом университете (ТРТУ) под руководством профессора А.В. Каляева получило серьезное развитие одно из направлений в рамках общей теории вычислительных систем с программируемой архитектурой – теория однородных цифровых интегрирующих структур (ОЦИС) и однородных вычислительных структур (ОВС) [36, 77, 85, 86].
Предложена идея построения микропроцессоров ОВС с программируемой (перестраиваемой) структурой, коммутацией и процессом, которые настраиваются на выполнение ограниченного набора крупных операций, а не на большое число мелких элементарных команд, как это делается в классических микропроцессорах. Такой подход к синтезу микропроцессоров и построению на их основе ОВС позволяет приблизить язык микропроцессоров к внешнему языку высокого уровня, увеличить скорость выполнения операций в микропроцессоре, облегчить распределение задач между параллельно работающими микропроцессорами в мультипроцессорной ОВС.
Начиная с 1972 года, профессором В.Ф. Гузиком совместно с сотрудниками кафедры вычислительной техники Таганрогского государственного радиотехнического университета развивается идея макроблочных ОЦИС с точки зрения построения модульных ОЦИС, в которых архитектурной единицей становятся функциональные модули (ФМ) – специализированные микропроцессоры (СМП), состоящие из определенного количества универсальных решающих блоков (УРБ) ОЦИС, коммутируемых между собой по функциональным признакам и реализующих базисные операторы, а математическое обеспечение строится на универсальном уровне отображения задач в модульную ОЦИС с помощью интерпретирующих или компилирующих трансляторов [14, 24, 25, 28 − 37, 39, 88]. Такого рода ОЦИС, являясь специализированными однородными вычислительными структурами, названы интегрирующими вычислительными структурами (ИВС).
В основу функционирования модульных ИВС положен тот же принцип представления информации (в виде приращений) и тот же способ ее переработки (численное интегрирование систем дифференциальных уравнений Шеннона), как и в ОЦИС. Поэтому с этой точки зрения модульные ИВС являются специализированным в отношении классов решаемых задач вычислительным устройством.
Интегрирующая вычислительная структура – это автомат с программируемой структурой, представляющий собой коммутируемую совокупность микропроцессоров, характеризующихся: специальным способом переработки информации; изменяемостью внутренней конфигурации; глобальностью распараллеливания вычислительного процесса; возможностью наращивания вычислительной мощности под воздействием базовой машины ИВС [1], которая объединяет в себе обрабатывающие и управляющие программы; конструктивно-технологической выполняемостью на больших интегральных схемах.
По мнению многих специалистов, будущие вычислительные машины и суперЭВМ должны быть модульными, расширяемыми и перестраиваемыми [36, 86, 96]. Модульность и перестраиваемость упрощают проектирование и создание систем и позволяют адаптировать систему к структурам решаемых задач, ресурсным возможностям и специфики областей применения.
Несмотря на то, что, как в нашей стране, так и за рубежом, достаточно широкое распространение получили цифровые специализированные вычислительные устройства, в настоящее время нельзя считать решенной задачу создания общей теории специализированных вычислительных структур, которая позволила бы разработчикам синтезировать на ее основе с минимальными затратами системы с требуемыми характеристиками с учетом специальных требований, определяемых условиями практического использования. Поэтому разработка вопросов общей теории организации структур и вычислительных процессов цифровых специализированных вычислительных систем на сегодняшний день является актуальной и требует серьёзного решения [36, 39, 40, 44, 46, 86].
В последние годы в цифровой вычислительной технике наибольшее развитие получили персональные компьютеры и проблемно – ориентированные системы. Как в первом и особенно во втором случае при проектировании вычислительных систем основное внимание уделяется достижению их максимальной производительности. Среди методов обработки данных наиболее высокопроизводительными считаются методы, которые ориентированы на параллельно-конвейерное выполнение вычислительных операций. В настоящее время разработаны и выпускаются несколько типов программируемых логических матриц, позволяющих создать параллельно-конвейерные вычислители. Задачей проектирования является выбор элементной базы и определение перечня базовых операций, реализация которых целесообразна на ПЛИС.
Процесс проектирования вычислительной части проблемно-ориентированной системы (ПОВС) включает следующие этапы.
На этапе постановки задачи определяется проблемная ориентация системы. Для этого рассматривается весь набор задач, подлежащий обработке, и выбирается круг наиболее близких по алгоритмической реализации задач. Рассматриваемый шаг необходим для ограничения круга базовых операций, которые реализуются аппаратно в ПЛИС или в системе.
При решении этих вопросов необходимо учитывать специфику конкретной области применения создаваемой системы. Основным критерием при выборе тех или иных решений является уровень производительности, который достигается системой обработки либо отдельным ее блоком, реализованным на основе заданной технологии.
Рассмотрим с этих позиций некоторые, наиболее характерные области применения методов цифровой обработки сигналов.
Обработка звуковых сигналов включает анализ, распознавание и синтез речи, телекоммуникацию, сжатие данных при их передаче по каналам связи. В большинстве случаев удовлетворительные результаты обеспечивает формат данных с фиксированной запятой и длиной слова 16 бит. При повышенных требованиях к качеству обработки возможен переход к 32-разрядному формату с плавающей запятой. Диапазон частот входных сигналов для задач обработки речи составляет 100 Гц – 4 кГц, поэтому частота дискретизации во многих случаях выбирается порядка 8 кГц. При обработке и передаче звуковых сигналов вообще, в том числе музыки, верхняя граница диапазона частот расширяется до 20 – 40 кГц. Частота дискретизации достигает в таких случаях 112 кГц и более. Используемые алгоритмы включают цифровую фильтрацию, спектральный анализ сигналов (вычисление дискретного (ДПФ) или быстрого (БПФ) преобразований Фурье), корреляционный анализ, обратную свертку, а также специальные алгоритмы типа линейного предсказания, динамического программирования для задач распознавания и т. д. Если реализуются блочные алгоритмы обработки данных, то размер блоков составляет от 128 до 256 выборок. Требуемая производительность в задачах обработки звуковых сигналов может достигать 6105 – 6106 умн./с.
Целями обработки изображений являются улучшение изображений, содержащих шумы, сжатие информации для передачи и хранения, распознавание образцов. Восстановление и улучшение изображений осуществляются фильтрацией с помощью инверсной свертки. Поскольку размеры обрабатываемых данных в этом случае достаточно велики (типовые значения 256х256 отсчетов и 512x512 отсчетов), то для решения задач линейной фильтрации изображений широко используются алгоритмы БПФ. При обработке изображений алгоритмы фильтрации, вычисления свертки и БПФ являются двумерными. Важный класс задач, связанных с восстановлением и улучшением изображений, возникает при анализе объектов различной природы методами проникающего излучения. Восстановление трехмерной структуры объекта по его проекциям осуществляется путем вычисления преобразований Фурье от проекций, формирования набора сечений объекта и вычисления обратного преобразования Фурье. Для улучшения качества таких изображений применяются методы пространственно - частотной фильтрации. Другой класс алгоритмов улучшения изображения образуют точечные операции, в том числе преобразование контрастности, выделение контуров, методы статистической обработки изображений.
Для сжатия информации при передаче и хранении изображений используются различного рода преобразования. Наиболее эффективным в статистическом смысле является преобразование Карунена-Лоэва, однако оно требует больших объемов вычислительных операций и не имеет быстрых алгоритмов выполнения. В отличие от преобразования Карунена-Лоэва ортогональные преобразования типа преобразования Фурье, Адамара, Уолша допускают быструю реализацию и обеспечивают достаточно эффективное сжатие исходных изображений, что является причиной их широкого распространения для решения таких задач.
Задачи распознавания образов для обработки изображений решаются теми же способами, что и для распознавания речи, однако объемы массивов данных при этом значительно возрастают и достигают 105 – 106 отсчетов. Разрядность данных, как правило, невелика и составляет 4 – 8 бит. Требуемая производительность оценивается цифрами 109 – 1012 оп./с.
Системы радиолокации выполняют поиск и обнаружение объектов в пространстве, определение координат и динамических параметров этих объектов и их классификацию. На основе полученных данных осуществляется принятие решения и управление соответствующими комплексами. Основным содержанием обработки данных в радиолокационной системе (РЛС) является согласованная фильтрация сигналов, поступающих от датчика-антенны. Диапазон частот входных сигналов составляет 10 МГц – 10 ГГц. Во многих случаях фильтрация осуществляется в частотной области на основе алгоритмов БПФ. Размеры преобразований могут достигать 214 комплексных точек, однако существуют задачи, в которых массивы данных имеют умеренные размеры: 1024, 512 и менее точек. В системах с фазированной антенной решеткой (ФАР) для формирования диаграммы направленности используется макрооперация скалярного произведения векторов (иногда называемая весовым суммированием). Разрядность входных данных в настоящее время составляет 6 – 8 бит, однако существует тенденция к ее увеличению до 10 – 12 бит и более. Требования по быстродействию оцениваются цифрами порядка 108 – 1010 умн./с.
Задачи гидролокации включают в основном те же операции, что и задачи радиолокации, т. е. формирование диаграммы направленности, спектральный анализ, корреляционный анализ и свертку, вторичную обработку сигналов для вывода информации на устройства отображения и решения задач управления. Соответственно используются такие алгоритмы, как скалярное произведение вещественных и комплексных векторов, одномерные прямые БПФ и обратные БПФ, двумерные (пространственно-временные) БПФ, вычисление корреляционных функций, одномерная и двумерная свертки и матричные операции, включая умножение матриц, обращение матриц и решение систем линейных уравнений. Особенностью гидроакустических сигналов является их более низкочастотной диапазон (2 – 40 кГц). С другой стороны, высокая зашумленность этих сигналов требует построения многоканальных систем с автоматической регулировкой усиления (АРУ), поэтому в современных гидролокационных системах объем вычислительных операций имеет такой же порядок, как и в РЛС (106 – 108 оп./с). Анализ изложенных выше требований по функциональным возможностям аппаратуры ЦОС, форматам данных, производительности позволяет выделить следующие основные моменты, которые встречаются часто и реализация которых представляется необходимой на первом этапе работ.
Используемые алгоритмы: фильтрация, вычисление свертки, БПФ. Форматы данных: 8 и 16 бит с фиксированной запятой. Производительность 108 – 1010 оп./с типа сложение – умножение.
После выбора круга задач, определяющих проблемную ориентацию системы, переходят к формирования технических требований к системе, другими словами – к формулировке технического задания на систему. В техническом задании задаются предельные тактико-технические характеристики системы. Эти характеристики системы являются рамочными, и это есть следствие компромисса между "желаемым" и "возможным". И он достигается в ходе дискуссии между заказчиком и исполнителем. Заказчик формулирует пожелания и требования к системе, особенностям ее организации, платит за изделие и принимает его. Исполнитель оценивает исходные данные, обосновывает возможность их воплощения и необходимые затраты на разработку и воплощение.
Когда компромисс найден и техническое задание сформулировано, приступают к этапу проектирования – этапу выбора методов решения задачи.
Использование методов цифровой обработки сигналов позволяет относительно легко обеспечить высокую помехоустойчивость систем обработки данных, необходимую точность и разрешающую способность, простое сопряжение подсистемы обработки сигналов с управляющей машиной, стабильность параметров тракта обработки данных и ряд других преимуществ. Поэтому за последние 20 – 25 лет процессоры ЦОС в том или ином виде стали неотъемлемой составной частью вычислительных комплексов, предназначенных для научных исследований или решения задач управления.
В книге [62] представлены результаты разработки специализированной элементной базы для параллельно-конвейерных систем, которая позволяет практически решать вопросы эффективной реализации систем такого типа с приемлемыми параметрами по габаритным размерам и потребляемой мощности.
В дальнейшем при описании процесса проектирования конкретных проблемно-ориентированных систем перечисленные этапы проектирования будут рассмотрены подробно.