Логический и физический параллелизм

Основные различия физического и логического параллелизма заключаются в их целях. Физический параллелизм предназначен для получения результата по входным данным за кратчайшее время. Основными целями логического параллелизма являются сокращение времени разработки, упрощение создания, эксплуатации и, в общем случае, сопровождения программных систем. В том и другом случаях предполагается выделение участков алгоритма, допускающих независимое или слабо зависимое исполнение.

Поскольку время получения результата складывается из времени разработки алгоритма и времени расчета, то для задач физического параллелизма также крайне желательно обеспечение значительной скорости разработки и высокого уровня сопровождаемости программ. Однако эти задачи отходят на второй план и даже приносятся в жертву основной цели — сокращению времени получения конечного результата. А в задачах логического параллелизма часто возникает желание уменьшить время выполнения алгоритма, например для увеличения функциональности системы. Другое дело — то, что до настоящего времени общепринятой практикой было ожидание новых решений от производителей вычислительных платформ.

Особенность физического параллелизма, обуславливающая сложность программирования, состоит в том, что структура максимально эффективного (с точки зрения времени вычисления) алгоритма зависит от топологии вычислительной системы.

Как преодолеть кризис?

К сожалению, «бесплатные обеды» на основе закона Мура закончились: средства повышения вычислительной мощности отдельного процессора практически исчерпаны, и остались лишь весьма неоднозначные небольшие резервы, которые обеспечиваются увеличением кэшируемой памяти [5].

Приходится констатировать, что архитектурные усовершенствования привели относительно однородную ИТ-индустрию к грани разделения на более мелкие области. Это вызвано тем, что физическое распараллеливание не работает в произвольном классе задач: увеличение разрядности процессора, использование гиперпотоковости(hyper-threading) и многоядерности могут дать эффект, противоположный ожидаемому, т.е. после распараллеливания время исполнения программы даже увеличится.

Не всякая задача допускает физическое распараллеливание [5]. Целые классы задач (например, быстрое Фурье-преобразование, обработка запроса к базе данных, быстрые алгоритмы сортировок и т.п.) не получают заметного выигрыша от распараллеливания либо не распараллеливаются в принципе. У разработчиков появляется альтернатива — вместо изменения структуры программы уделять больше внимания локальной оптимизации кода. До некоторого предела это окажется рабочим вариантом, причем будет поддержано ростом интереса к средствам разработки, ориентированным на высокоскоростное исполнение в рамках однопроцессорной архитектуры.

Возникает проблема совместимости старых, написанных для однопроцессорных архитектур, библиотек. Если библиотеки физически не поддерживают параллельное исполнение, то распараллеливание алгоритма может привести к ошибке. Не случайно Intel расширяет программистскую составляющую своей деятельности, в частности — для создания безопасных библиотек, которые предполагают и гибкую настройку на конкретную вычислительную платформу. По-видимому, в ближайшем будущем речь пойдет о динамически реконфигурируемых библиотеках, конечный вид которых будет определяться при загрузке задачи и выявлении текущей топологии системы.

Не вполне ясен вопрос объектно-ориентированного программирования: нет исследований по совместимости объектно-ориентированного программирования с многоядерной архитектурой процессора. Текущий стандарт ISO на Си++ тактично обходит стороной физический параллелизм, а между тем, например, Intel пишет специализированные библиотеки на «чистом» Си.

Вполне возможно, что определенное полезное использование многоядерной архитектуры без реинжиниринга старых программ операционные системы могут обеспечить на уровне задач. Однако в силу небольшого числа задач такой подход имеет вполне естественные ограничения.

Необходимо отметить видимые преимущества микроядерных архитектур ОС, которые (в отличие от монолитных, оптимизированных для однопроцессорных систем) допускают физическое распараллеливание.

С одной стороны, на рынке появлялось достаточно привлекательное, но все более требовательное к быстродействию персонального компьютера программное обеспечение. С другой — производители ПК создавали все более мощные обновленные решения. Возникавшая при этом межверсионная несовместимость приводила к тому, что пользователи выбрасывали свои старые ПК. Другими словами, происходило постоянное (примерно раз в два-три года) обновление парка персональных компьютеров, системного и прикладного программного обеспечения. Теперь эта идиллия закончилась, и поиск новых областей применения для предлагаемых архитектур персональных компьютеров становится крайне актуальным.

Главной тенденцией программирования уже в ближайшее время станет создание новых языков и техник, совмещающих удобство разработки и физический параллелизм исполнения. Этого удастся добиться только за счет решения вопросов, связанных с физическим параллелизмом. Увы, существующие решения типа pthread и OpenMP можно расценивать лишь как паллиатив. Ручное управление физическим параллелизмом(explicit parallelism) отбрасывает программирование назад, в эпоху машинных кодов и ассемблеров, реанимируя привязанность структуры программы к физической архитектуре вычислительной платформы.

Автоматическое распараллеливание(implicit parallelism) для многоядерных архитектур в большинстве случаев обеспечивает ускорение лишь с некоторой вероятностью. Промежуточным решением могут быть уже упоминавшиеся реконфигурируемые библиотеки (Integrated Performance Primitives, MathKernelLibrary).

Наиболее перспективны языки и техники, которым естественно присущ логический параллелизм, независимость или слабая зависимость компонентов друг от друга. В первую очередь, речь идет о многозадачном логическом параллелизме. Существующие наработки — это, в сущности, «полуфабрикаты» для многоядерной платформы. Явный недостаток многозадачности состоит в том, что практически нереально придумать убедительный случай загрузки персонального компьютера достаточным количеством (десятком и более) действительно ресурсоемких задач.

Другая возможность — попытаться адаптировать к многоядерным архитектурам существующие техники и языки многопоточной организации программ. Опыт применения языка Рефлекс [4] в многопроцессорных системах показывает, что такое вполне допустимо. Правда, появляющиеся при этом сущности означают достаточно радикальное изменение программ на уровне машинных команд. Например, происходит очевидный отказ от использования стека при организации структуры программы. При создании программ меняется и восприятие процесса программирования: классические функции дополнены процессами, которые при их запуске порождают отдельный независимый поток команд и данных.

<<< < Предыдущая 1 2 3 45 / 65 6 > Следующая >>>

Соседние файлы в папке Лекция2_Многоядерные процессоры

#
30.03.201571.17 Кб37C2D.doc
#
30.03.2015485.38 Кб57Анализ развития процессоров фирмы Intel IA.doc
#
30.03.2015988.67 Кб41Двухъядерные процессоры Intel и AMD ч1.doc
#
30.03.2015412.67 Кб39Двухъядерные процессоры Intel и AMD ч2.doc
#
30.03.2015509.44 Кб52Лекция многоядерность.doc
#
30.03.2015387.58 Кб40Многоядерные процессоры и программирование.doc
#
30.03.2015107.01 Кб62Многоядерные процессоры.doc
#
30.03.201524.06 Кб40Сайты о процессорах.doc
#
30.03.2015111.62 Кб42Технология Hyper-Treading.doc
#
30.03.2015428.54 Кб69Технология HyperTransport.doc
#
30.03.20152.77 Mб129Центральные процессоры.doc