Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

vestnik_ugatu_last7.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

3.64 Mб

Скачать

☆

1 / 61 2 3 4 5 6 > Следующая >>>

УДК 519.7

А.Н. Сальников, А.И. Майсурадзе, Д.Ю. Андреев, Г.А. Костин

Кластеризация результатов тестирования коммуникационной среды многопроцессорных

систем: единицы анализа, исследование методов, визуализация результатов

Число процессорных элементов в cуперкомпьютерах постоянно растет, что приводит к росту сложности организации коммуникационной среды. С целью минимизации потерь производительности от задержек в коммуникационной среде и облегчения понимания особенностей поведения коммуникационной среды применяются различные подходы к сбору статистической информации о передачи сообщений и последующему анализу собранной информации. Рассматривается подход, основанный на измерении задержек при передаче сообщений с помощью специальных тестов. В ходе исполнения тесты создают огромный объем данных, которые невозможно проанализировать вручную. Рассматриваются задачи сжатия, визуализации, автоматического анализа таких данных, которые предлагается решать с помощью методов кластеризации.

Результаты анализа предлагается использовать при создании и оптимизации параллельных программ, для обнаружения аномалий коммуникационной среды и выявления проблемных узлов вычислительного кластера.

В работе рассмотрено применение методов дивизизной, агломеративной кластеризации, и локальной последовательной кластеризации к данным полученным с суперкомпьютеров: «Ломоносов-МГУ», «Скиф-МГУ», «Bluegene-MГУ».

Интеллектуальный анализ данных; кластерный анализ; большой объем данных; синтетические MPI-тесты; коммуникационная среда многопроцессорных систем.

Введение

Современные тенденции развития многопроцессорной техники, предназначенной для решения задач математического моделирования, направлены на увеличение числа процессорных элементов, что, в свою очередь, опосредованно влечет увеличение сложности организации коммуникаций между этими процессорными элементами. На сегодняшний день в СНГ (согласно [1]) зарегистрировано 13 многопроцессорных систем с общим числом процессорных элементов больше 1000. В мире (согласно [2]) насчитывается 291 система с числом процессоров от 4 до 8 тысяч, а также 147 систем, где число процессоров превышает 8 тысяч. Сложности возникают уже при анализе коммуникационной среды для тысячи процессоров. С увеличением числа процессоров сложности обработки и анализа растут многократно.

Наиболее популярной технологией программирования для указанных систем является Message Passing Interface (MPI) [3]. Однако наблюдаются серьезные проблемы при использовании реализаций MPI на машинах с более чем 5000 процессоров (например, см. [4]), часть из них связана с неэффективностью алгоритмов, заложенных в реализации MPI, на большом числе процессоров. Архитектура и масштаб коммуникационной среды могут сильно повлиять на различие во времени передачи сообщений между процессами. Чем больше процессоров в системе, тем большее время обычно требуется на передачу данных от одного MPI-процесса к другому, и тем большая неоднородность наблюдается в величинах задержек при передаче сообщений. Из-за большого числа процессоров в большинстве случаев коммуникационная среда многопроцессорной системы неоднородна, разные пары процессоров могут взаимодействовать с разной скоростью. Это приводит к сложности понимания поведения коммуникационной среды, к сложности анализа поведения параллельной программы, к потере производительности и масштабируемости параллельного кода.

С целью минимизации потерь и облегчения понимания сути происходящих явлений применяются некоторые ухищрения. Первый подход основан на измерении задержек, информация о которых получается после сбора статистики по трассам, получаемым после выполнения параллельной программы. Изучение трасс позволит выдать рекомендации о том, что нужно изменить в коде, чтобы сократить время исполнения программы. К программным средствам, которые придерживаются такого подхода, можно отнести, например: Scalasca [5], Vampir [6], Intel Trace Analiser, Tau [7]. Второй подход основан на измерении задержек с помощью некоторых специальных тестов заранее, до начала выполнения параллельной программы и последующем использовании полученных результатов тестирования при исполнении программы. К таким системам относятся средства синтетического тестирования MPI: Intel MPI Benchmark [8], MPI-bench-suit [9], SkaMPI [10], MPIBlib [11], а также разрабатываемое на Факультете ВМК МГУ имени М.В. Ломоносова программное средство network_test2 [12], которое является частью проекта PARUS [13,14]. Результаты тестирования могут быть использованы не только разработчиками при создании и оптимизации параллельных программ, но и системными администраторами для обнаружения аномалий и выявления проблемных узлов вычислительного кластера.

В настоящий момент оба рассматриваемых подхода в процессе исполнения своих программных частей создают огромный объем данных разнообразного характера, которые невозможно проанализировать вручную. Требуется разработка методов сжатия, визуализации, автоматического анализа таких данных для выявления аномалий и закономерностей. Указанные задачи предлагается решать с помощью алгоритмов кластеризации [15].

В данной работе методы кластеризации применяются для различных объектов. Сначала в качестве объектов рассматриваются отдельные процессы, причем игнорируется различие между процессами-источниками и процессами-приемниками. В следующем разделе объектами станут пары процессов (источник, приемник). Наконец, в качестве объектов будут рассмотрены тройки (источник, приемник, длина сообщения).

1 / 61 2 3 4 5 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.202524.9 Кб0Version A.docx
#
01.07.2025719.87 Кб0versiya_3_0_-_5_2_(2)_31.10.2016.doc
#
01.07.20253.93 Mб0verstka.docx
#
01.04.20257.66 Mб25vertolet Ми-8Т.docx
#
01.05.20251.65 Mб0Vertyaev_-_soderzh.doc
#
01.07.20253.64 Mб0vestnik_ugatu_last7.docx
#
05.05.2019495.62 Кб3vetom-micro.doc
#
01.05.202583.46 Кб0vf 1.doc
#
01.05.2025203.78 Кб0vf 2-1.doc
#
01.05.2025120.32 Кб0VF_2013.doc
#
01.07.2025300.03 Кб0Vibor kafedri 2015.doc