
- •1 Задачи анализа;
- •2 Задачи синтеза;
- •3 Задачи идентификации.
- •Основные задачи теории кс
- •1. Задачи анализа;
- •2. Задачи синтеза;
- •3. Задачи идентификации.
- •2. Высокой интенсивностью взаимодействия и вытекающим отсюда требованием уменьшения времени ответа.
- •Функционирование кс
- •Основные задачи теории вычислительных систем
- •Общая характеристика методов теории вычислительных систем
- •3. Классификация вычислительных систем
- •Характеристики производительности и надежности кс
- •Характеристики надежности кс
- •1 Холодное резервирование. Работает только основной канал.
- •2 Нагруженный резерв. Включены оба канала (резервный канал занимается посторонними задачами). Время перехода на основную задачу меньше чем в холодном резерве.
- •Общая характеристика методов теории вычислительных систем
- •Характеристики производительности кс
- •1. Номинальная производительность ;
- •2. Комплексная производительность ;
- •3. Пакеты тестовых программ spec XX
- •Характеристики надежности кс
- •1 Холодное резервирование. Работает только основной канал.
- •2 Нагруженный резерв. Включены оба канала (резервный канал занимается посторонними задачами). Время перехода на основную задачу меньше чем в холодном резерве.
- •4) Указывается начальное состояние системы;
- •8) Находятся показатели качества вс на основе найденных вероятностей состояния системы.
- •Анализ надежности кс со сложной структурой
- •2.Расчет надежности кс
- •2. Для каждой вершины можно вычислить среднее количество попаданий вычислительного процесса в эту вершину по формуле
- •1. Разбить множество операторов на классы:
- •Модели вычислительных систем как систем массового обслуживания
- •1 Общие понятия и определения
- •Например m/m/1
- •2 Параметры систем массового обслуживания
- •Модели массового обслуживания вычислительных систем|
- •1. Представление вычислительной системы в виде стохастической сети
- •2. Потоки заявок
- •3. Длительность обслуживания заявок
- •Характеристики одноканальных смо
- •Многопроцессорные системы
- •5. Характеристики бесприоритетных дисциплин обслуживания
- •1) В порядке поступления (первой обслуживается заявка, поступившая раньше других);
- •2) В порядке, обратном порядку поступления заявок (первой обслуживается заявка, поступившая позже других);
- •3) Наугад, т. Е. Путем случайного выбора из очереди.
- •6. Характеристики дисциплины обслуживания с относительными приоритетами заявок
- •3.8. Характеристики дисциплин обслуживания со смешанными приоритетами
- •§ 3.9. Обслуживание заявок в групповом режиме
- •§ 3.10. Смешанный режим обслуживания заявок
- •§ 3.11. Диспетчирование на основе динамических приоритетов
- •§ 3.12. Оценка затрат на диспетчирование
- •1.Определяется интенсивность потока заявок I в смо Si из системы алгебраических уравнений
- •2.Вычисляются коэффициенты передач для каждой смо
- •3.Определяется среднее время обслуживания Ui заявки в смо Si :
- •6.Для моделирующей сети в целом характеристики п.5 определяются как
- •2.Расчет характеристик мультипроцессорной системы
- •1) Имеет доступ к общей памяти;
- •1.Средняя длина очереди заявок, ожидающих обслуживания в системе:
- •3. Среднее время пребывания заявок в системе :
- •Основные задачи теории кс
- •1. Задачи анализа;
- •2. Задачи синтеза;
- •3. Задачи идентификации.
- •1) С неограниченным временем пребывания заявок;
- •2) С относительными ограничениями на время пребывания заявок;
- •3) С абсолютными ограничениями на время пребывания заявок;
- •2.4. Контроллеры и сетевые комплексы ge Fanuc
- •Модели 311,313/323, 331
- •Коммуникационные возможности серии 90-30
- •2.4.3. Контроллеры VersaMax
- •2.4.4. Программное обеспечение
- •Общая характеристика протоколов и интерфейсов асу тп
- •2. Протоколы и интерфейсы нижнего уровня.
- •2. Основные технические характеристики контроллеров и программно-технических комплексов
- •Требования к корпоративной сети
- •2) Одновременное решение различных задач или частей одной задачи;
- •3) Конвейерная обработка информации.
- •1. Суть проблемы и основные понятия
- •1.1 Главные этапы распараллеливания задач
- •1.2 Сведения о вычислительных процессах
- •1.3 Распределенная обработка данных
- •1. Классификации архитектур параллельных вычислительных систем
- •1.1 Классификация Флинна
- •1. Процессоры
- •Память компьютерных систем
- •Простые коммутаторы
- •Простые коммутаторы с пространственным разделением
- •Составные коммутаторы
- •Коммутатор Клоза
- •Баньян-сети
- •Распределенные составные коммутаторы
- •Коммутация
- •Алгоритмы выбора маршрута
- •Граф межмодульных связей Convex Exemplar spp1000
- •Граф межмодульных связей мвс-100
- •3. Граф межмодульных связей мвс-1000
- •1. Построения коммуникационных сред на основе масштабируемого когерентного интерфейса sci
- •2. Коммуникационная среда myrinet
- •3. Коммуникационная среда Raceway
- •4. Коммуникационные среды на базе транспьютероподобных процессоров
- •1. Структура узла
- •2. Пакеты и свободные символы
- •3. Прием пакетов
- •4. Передача пакетов
- •5. Управление потоком
- •1. Структура адресного пространства
- •2. Регистры управления и состояния
- •3. Форматы пакетов
- •Когерентность кэш-памятей
- •1. Организация распределенной директории
- •2. Протокол когерентности
- •3. Алгоритм кэширования.
- •1 . Основные характеристики
- •1.2. Происхождение
- •1.3. Механизм когерентности
- •1. 4. Предназначение
- •1. 5. Структура коммуникационных сред на базе sci
- •1. 6. Физическая реализация
- •1. 7. Обозначение каналов
- •2. Реализация коммуникационной среды
- •2.1. На структурном уровне коммуникационная среда состоит из трех компонентов, как показано на рис. 2.1:
- •Масштабируемый когерентный интерфейс sci
- •Сетевая технология Myrinet
- •Коммуникационная среда Raceway
- •Коммуникационные среды на базе транспьютероподобных процессоров
- •1.Информационные модели
- •1.2. Мультипроцессоры
- •1.3. Мультикомпьютеры
- •Сравнительный анализ архитектур кс параллельного действия.
- •Архитектура вычислительных систем
- •Smp архитектура
- •Симметричные мультипроцессорные системы (smp)
- •Mpp архитектура
- •Массивно-параллельные системы (mpp)
- •Гибридная архитектура (numa)
- •Системы с неоднородным доступом к памяти (numa)
- •Pvp архитектура
- •Параллельные векторные системы (pvp)
- •1. Системы с конвейерной обработкой информации
- •1.2 Мультипроцессоры uma с много- ступенчатыми сетями
- •Мультипроцессоры numa
- •Мультипроцессор Sequent numa-q
- •Мультикомпьютеры с передачей сообщений
- •1. Общая характеристика кластерных систем.
- •2.Особенности построения кластерных систем.
- •Планирование работ в cow.
- •Без блокировки начала очереди (б); заполнение прямоугольника «процессоры-время» (в). Серым цветом показаны свободные процессоры
- •Общие сведения
- •Общие сведения
- •Логическая структура кластера
- •Логические функции физического узла.
- •Устройства памяти
- •Программное обеспечение
- •Элементы кластерных систем
- •1.1. Характеристики процессоров
- •Рассмотрим в начале процессор amd Opteron/Athlon 64.
- •Примеры промышленых разработок
- •Кластерные решения компании ibm
- •Диаграмма большого Linux-кластера.
- •Аппаратное обеспечение
- •Вычислительные узлы, выполняющие основные вычислительные задачи, для которых спроектирована система.
- •Программное обеспечение
- •Кластерные решения компании hp
- •Кластерные решения компании sgi
- •Производительность операций с плавающей точкой
- •Производительность памяти
- •Производительность системы ввода/вывода Linux
- •Масштабируемость технических приложений
- •Системное программное обеспечение
- •Архитектура san
- •Компоненты san
- •Примеры решений на основе san
- •San начального уровня
- •San между основным и резервным центром
- •Практические рекомендации
- •Построение san
- •Заключение
- •Принципы построения кластерных архитектур.
- •Оценки производительности параллельных систем
- •1) Имеет доступ к общей памяти;
- •2) Имеет общий доступ к устройствам ввода-вывода;
- •3) Управляется общей операционной системой, которая обеспечивает требуемое взаимодействие между процессорами и выполняемыми им программами как на аппаратном, так и на программном уровне.
- •4 Вероятность того, что в момент поступления очередной заявки все n процессоров заняты обслуживанием
- •Выбор коммутационного компонента.
- •Проблема сетевой перегрузки.
- •1. Обзор современных сетевых решении для построения кластеров.
- •1000-Мега битный вариант Ethernet
- •Организация внешней памяти
- •Эффективные кластерные решения
- •Концепция кластерных систем
- •Разделение на High Avalibility и High Performance системы
- •3. Проблематика High Performance кластеров
- •Проблематика High Availability кластерных систем
- •Смешанные архитектуры
- •6.Средства реализации High Performance кластеров
- •7.Средства распараллеливания
- •8.Средства реализации High Availability кластеров
- •9.Примеры проверенных решений
- •Архитектура san
- •Компоненты san
- •Примеры решений на основе san
- •San начального уровня
- •San между основным и резервным центром
- •Практические рекомендации
- •Построение san
- •Заключение
- •Symmetrix десять лет спустя
- •Матричная архитектура
- •Средства защиты данных
- •Ревизионизм и фон-неймановская архитектура
- •Литература
- •Связное программное обеспечение для мультикомпьютеров
- •1. Синхронная передача сообщений.
- •2. Буферная передача сообщений.
- •Планирование работ в cow
- •Средства распараллеливания
- •7.Средства распараллеливания
- •2. Кластерн ый вычислительн ый комплекс на основе интерфейса передачи сообщений
- •2.2 Программная реализация интерфейса передачи сообщений
- •2.3 Структура каталога mpich
- •2.4 «Устройства» mpich
- •2.5 Выполнение параллельной программы
- •2.6 Особенности выполнения программ на кластерах рабочих станций
- •2.7 Тестирование кластерного комплекса
- •Параллельная виртуальная машина
- •3 Кластерн ый вычислительн ый комплекс на основе пАраллельной виртуальной машины
- •3.1 Параллельная виртуальная машина
- •3.1.1 Общая характеристика
- •3.1.2 Гетерогенные вычислительные системы
- •3.1.3 Архитектура параллельной виртуальной машины
- •3.2 Настройка и запуск параллельной виртуальной машины
- •3.3 Структура каталога pvm
- •3.4 Тестирование параллельной виртуальной машины
- •На рисунке 3.2 представлена диаграмма, отображающая сравнение производительности коммуникационных библиотек mpi и pvm.
- •3.5 Сходства и различия pvm и mpi
- •4 . Кластерн ый вычислительн ый комплекса на основе программного пакета openMosix
- •4.1 Роль openMosix
- •4.2 Компоненты openMosix
- •4.2.1 Миграция процессов
- •4.2.2 Файловая система openMosix (oMfs)
- •4.3 Планирование кластера
- •4.4 Простая конфигурация
- •4.4.1 Синтаксис файла /etc/openmosix.Map
- •4.4.2 Автообнаружение
- •4. 5. Пользовательские утилиты администрирования openMosix
- •4. 6. Графические средства администрирования openMosix
- •4. 6.1 Использование openMosixView
- •4. 6.1.2 Окно конфигурации. Это окно появится после нажатия кнопки “cluster-node”.
- •4. 6.1.3 Окно advanced-execution. Если нужно запустить задания в кластере, то диалог "advanced execution" может сильно упростить эту задачу.
- •4.6.1.4 Командная строка. Можно указать дополнительные аргументы командной строки в поле ввода вверху окна. Аргументы приведены в таблице 9.2.
- •4. 6.2.2 Окно migrator. Этот диалог появляется, если кликнуть на каком-либо процессе из окна списка процессов.
- •4. 6.2.3 Управление удалёнными процессами. Этот диалог появляется при нажатии кнопки “manage procs from remote”
- •4.5.3 Использование openMosixcollector
- •4. 6.4 Использование openMosixanalyzer
- •4. 6.4. 1 Окно load-overview. Здесь отображается хронология нагрузки openMosix.
- •4. 6.4. 2 Статистическая информация об узле
- •4.5.4.3 Окно memory-overview. Здесь представляется обзор использования памяти (Memory-overview) в openMosixanalyzer.
- •4. 6.4.4 Окно openMosixhistory
- •4. 6.5 Использование openMosixmigmon
- •4.6 Список условных сокращений
- •Перечень ссылок
- •Общие сведения
- •2. Создание Windows-кластера
- •Суперкомпьютерная Программа "скиф"
- •Описание технических решений
- •Направления работ
- •Основные результаты
- •Кластер мгиу
- •Содержание
- •Понятие о кластере
- •Аппаратное обеспечение
- •Пропускная способность и латентность
- •1. Определение распределенной системы
- •2.1. Соединение пользователей с ресурсами
- •2.2. Прозрачность
- •Прозрачность в распределенных системах
- •2.3. Открытость
- •2.4. Масштабируемость
- •3.1. Мультипроцессоры
- •3.2. Гомогенные мультикомпьютерные системы
- •3.3. Гетерогенные мультикомпьютерные системы
- •4. Концепции программных решений рс
- •4.1. Распределенные операционные системы
- •4.2. Сетевые операционные системы
- •4.3. Программное обеспечение промежуточного уровня
- •5. Модель клиент-сервер рс
- •5.1. Клиенты и серверы
- •5.2. Разделение приложений по уровням
- •5.3. Варианты архитектуры клиент-сервер
- •Формы метакомпьютера
- •Настольный суперкомпьютер.
- •2. Интеллектуальный инструментальный комплекс.
- •Сетевой суперкомпьютер.
- •Проблемы создания метакомпьютера
- •Сегодняшняя архитектура метакомпьютерной среды
- •Взаимосвязь метакомпьютинга с общими проблемами развития системного по
- •5. Модель клиент-сервер рс
- •5.1. Клиенты и серверы
- •5.2. Разделение приложений по уровням
- •5.3. Варианты архитектуры клиент-сервер
- •Symmetrix десять лет спустя
- •Матричная архитектура
- •Средства защиты данных
- •Ревизионизм и фон-неймановская архитектура
- •Однородные вычислительные среды
- •Однокристальный ассоциативный процессор сам2000
- •Модели нейронных сетей
- •Модели инс
- •Оптимизационные системы.
- •Неуправляемые системы распознавания образов.
- •Системы feed forward.
- •Элементы нейрологики с позиции аппаратной реализации
- •Реализация нейронных сетей
- •Программные нейрокомпьютеры
- •Программно-аппаратные нейрокомпьютеры
- •Практическое использование инс
Устройства памяти
Большинство кластеров требуют, чтобы узлы имели параллельный доступ к устройствам памяти, а также к одним и тем же файлам и базам данных. Нужда в очень быстром и надёжном доступе к данным особенно велика в высокопроизводительных вычислительных кластерах. В зависимости от конфигурации и приложений, которые запускаются на кластере, можно выбрать различные опции памяти, которые обеспечивают требуемую производительность и надёжность.
Существуют две основные опции конфигурации памяти: прямой доступ и распределённое хранение.
При прямом доступе каждый узел может напрямую выходить на все имеющиеся системы хранения информации, при распределенном хранении существуют один или несколько узлов ввода-вывода, которые и управляют всеми средствами хранения в системе, осуществляя поиск, резервное копирование и миграцию файлов по системе.
Программное обеспечение
Программное обеспечение так же, как и аппаратное является неотъемлемой частью кластера. Существует системное программное обеспечение, которое в большой степени и определяет конфигурацию кластера.
Операционная система. Толчком к увеличению интереса к системе Linux послужила его низкая стоимость и богатые функциональные возможности для развёртывания и управления приложениями.
Программное обеспечение управлением кластера. Инструментарий для управления кластером обеспечивает средства для эффективной компоновки, управления и расширения кластеров.
Поддержка высокопроизводительной файловой системы. В зависимости от конкретного приложения часто требуется, чтобы большое число узлов имело возможность одновременного (и параллельного) высокоскоростного доступа к одним и тем же файлам.
Элементы кластерных систем
1.1. Характеристики процессоров
64-х разрядные процессоры AMD Opteron/Athlon 64
Intel Itanium 2
Intel Xeon
Intel Pentium 4
AMD Athlon
Рассмотрим в начале процессор amd Opteron/Athlon 64.
Компания AMD выпустила на рынок процессоры нового поколения, основанные на ядре Hammer – Athlon 64 и Opteron. Первый предназначен для рынка персональных компьютеров, а второй — для рынка серверов.
Ключевые составляющие новых процессоров:
архитектура х86-64
ядро процессора
интегрированный контроллер памяти
шина ввода/вывода на основе Hyper Transport
Для перехода на 64-разрядную архитектуру компания AMD предложила расширение существующей архитектуры i386 в отличие от Intel с ее кардинально новым решением IA-64. При этом процессоры AMD сохраняют непосредственную совместимость с 32-х разрядными приложениями, в то время как процессоры на базе IA-64 вынуждены использовать специальный режим эмуляции, заметно снижающий производительность таких приложений.
В процессорах с ядром Hammer в 64-х разрядном режиме применяется "плоская" модель памяти, количество регистров общего назначения расширено до 16. Процессор имеет несколько режимов работы: кроме стандартных, существовавщих еще в i386, введен особый режим — Long mode. Когда он включен (бит LME выставлен в единицу), существует два частных режима работы процессора. В одном из них процессор находится в режиме совместимости, во втором — в полном 64-х разрядном режиме. Два частных режима необходимы для одновременной поддержки (в случае использования 64-х разрядной ОС) как 32-х (в этом случае и нужен режим совместимости), так и 64-х разрядных приложений. При этом переключения частных режимов Long mode происходят весьма быстро, в отличие от переключения режимов работы процессора.
По информации компании в настоящее время ведутся работы над несколькими независимыми версиями компиляторов для процессоров с архитектурой x86-64, которые позволят использовать преимущества х86-64: 8 дополнительных регистров общего назначения, 8 дополнительных регистров SSE2 и т.д. В то же время с успехом могут использоваться с 32-х разрядные компиляторы, что обеспечит работу процессора и в случае задержки разработки ПО для новой архитектуры.
Athlon 64 с рейтингом 3100+, что соответствует реальной частоте в районе 1,8 ГГц. В дальнейшем, видимо, модельный ряд будет следующим: 2800+ (1,6 ГГц), 3100+ (1,8 ГГц), 3400+ (2,2 ГГц), 3700+ (2,4 ГГц), 4000+ (2,6 ГГц) и 4300+ (2,8 ГГц).
Процессор Operton предназначен для использования в первую очередь в многопроцессорных системах. При этом архитектура такой системы представляет собой гибрид NUMA и SMP. С одной стороны, по распределению памяти это типичная NUMA архитектура (с неравномерным доступом к памяти), так как время доступа к памяти зависит от того, локальная ли это память. С другой стороны, AMD настаивает, что с точки зрения программной модели это SMP: неравномерность доступа составляет не разы, а проценты. AMD дала этой архитектуре название SUMO. Многопроцессорные конфигурации могут состоять из 4 процессоров, а при использовании дополнительных коммутаторов Hyper Transport и более.
Intel Itanium 2
|
Процессор Intel Itanium 2 является вторым процессором в семействе процессоров на базе архитектуры IA-64. Архитектура IA-64 выходит за пределы подходов RISC и CISC путем применения явных команд параллельных вычислений (EPIC - Explicit Parallel Instruction Computing), объединяя вычислительные ресурсы с работой компиляторов, что позволяет осуществить явное распараллеливание на процессоре. Архитектура с высокой параллельностью вычислений EPIC позволяет процессору выполнять до 20 операций за один такт. Внутренние ресурсы процессора комбинируются с предикативными и спекулятивными алгоритмами, что позволяет осуществлять оптимизацию высокопроизводительных приложений, запускаемых в большинстве операционных систем, включая версии Microsoft Windows, HP-UX и Linux. |
Архитектура IA-64 не является как 64-х разрядным расширением 32-х разрядной архитектуры х86 компании Intel, так и переработкой 64-разрядной архитектуры PA-RISC компании HP.
IA-64 представляет собой нечто абсолютно новое: архитектуру, использующую длинные слова команд (long instruction words - LIW), предикаты команд (instruction predication), устранение ветвлений (branch elimination), предварительную загрузку данных (speculative loading) и другие способы максимального извлечения параллелизма из кода программ.
Теоретическая пиковая производительность процессора при работе с числами с плавающей точкой 64-х разрядной точности составляет 4 Гфлоп/с при тактовой частоте 1 ГГц. При использовании 32-х разрядной точности пиковая производительность удваивается.
Совместимость с 32-х разрядным кодом обеспечивается специальным блоком декодирования и управления IA-32. По сути, выполнение 32-х разрядного кода происходит в режиме эмуляции, что отрицательно сказывается на производительности.
Как сообщается на сайте компании Intel, процессор Itanium 2 может содержать конструктивные дефекты или погрешности (errata), которые могут вызвать отклонение поведения продукции от предусмотренного в опубликованных спецификациях. Сведения о выявленных погрешностях и отклонениях предоставляются по запросу.
По результатам тестирования пакетом Linpack системы на Itanium 2 (1 ГГц) достигали максимальной производительности ~3,5 Гфлоп (N = 1000) при пиковой производительности 4 Гфлоп.
32-х разрядные процессоры
Intel Xeon
Отличительная особенность последних процессоров семйства Xeon — поддержка технологии, получившей название Hyper Threading. Впервые технология Hyper Threading была реализована в процессоре Intel Xeon MP (Foster MP). Xeon MP официально использует родственное Pentium 4 Willamette ядро, содержит 256 Kбайт L2-кэша и 512 Kбайт/1 Mбайт L3-кэша и поддерживает работу в 4-процессорных конфигурациях.
Принцип действия Hyper Threading основывается на том, что в каждый момент времени только часть ресурсов процессора используется при выполнении программного кода. Неиспользуемые ресурсы также можно загрузить работой: например, задействовать для параллельного выполнения еще одного приложения (либо другого потока этого же приложения).
В одном физическом процессоре Intel Xeon формируются два логических процессора (LP – Logical Processor), которые разделяют между собой вычислительные ресурсы CPU. Операционная система и приложения "видят" именно два CPU и могут распределять работу между ними, как и в случае полноценной двухпроцессорной системы.
Недавно Intel выпустила новую версию процессора с 533 мегагерцовой шиной. Существуют версии, работающие на тактовой частоте 2,80, 2,66, 2,40 и 2 ГГц.
По результатам тестирования пакетом Linpack системы на Xeon (2 ГГц) достигали максимальной производительности ~1,6 Гфлоп (N = 1000) при пиковой производительности 2 Гфлоп.
Intel Pentium 4
Pentium 4 — основной массовый процессор компании Intel, широко применяемый в настольных системах. Последние версии поддерживают технологию Hyper Threading, впервые появившуюся в процессорах Xeon. Последние версии Xeon используют ядро Prestonia, родственное ядру Pentium 4. Процессор относительно дешев, поэтому нередко применяется в недорогих кластерных системах.
AMD Athlon
Процессор AMD Athlon XP основан на архитектуре QuantiSpeed, характеристиками которой являются:
суперскалярная (имеющая несколько конвейеров и предусматривающая возможность выполнения более одной скалярной команды за такт) микроархитектура;
суперскалярный блок вычислений с плавающей точкой, выполняющий больше операций за такт, чем конкурирующие устройства семейства x86;
упреждающая выборка данных из памяти в кэш первого уровня, реализованная на аппаратном уровне;
специальные быстро работающие TLB-буферы (Translation Look-aside Buffers), хранящие схемы отображения данных и исключающие их повторение в кэше 2-ого уровня.
Процессор также поддерживает технологию 3DNow Professional, включающую операции для ускорения обработки мультимедийных данных. Модификация XP (extreme performance) процессора AMD Athlon возникла в результате сотрудничества AMD с Microsoft.
Athlon MP — процессор для двухпроцессорных решений от AMD, конкурент Intel Xeon. По результатам тестирования пакетом Linpack системы на Athlon MP 1800+(1530 МГц) достигали максимальной производительности ~1,7 Гфлоп (N = 1000) при пиковой производительности 3 Гфлоп.
Выводы
Большая часть систем, строящихся в настоящее время по технологии Beowulf-кластеров, создаются на основе процессоров Intel Xeon.
Так, восьмое место в списке занимает система с максимальной производительностью 3 337 Гфлоп (пиковая – 6 758 Гфлоп), состоящая из 768 двухпроцессорных узлов на базе Xeon 2,2 ГГц, расположенная в Forecast Systems Laboratory при NOAA. (Системные интеграторы: HPTi and Aspen Systems). В качестве межузловых соединений используется Myrinet 2000. Intel Xeon обладает рядом преимуществ по сравнению с альтернативными вариантами, в частности он использует перспективную технологию Hyper Threading для увеличения производительности параллельно выполняющихся задач. Кроме того, существует возможность построения вычислительных SMP-узлов с использованием до 4-х процессоров Xeon. На наш взгляд, среди 32-х разрядных процессоров Intel Xeon является предпочтительным вариантом. Этот процессор уже имеет хорошую репутацию среди создателей кластерных систем.
Если же рассматривать вариант вычислительного кластера на базе 64-х разрядных процессоров, то из двух возможных вариантов Intel Itanium 2 и AMD Opteron в ближайшее время более перспективным и в первую очередь безопасным с точки зрения вложения инвестиций в аппаратное обеспечение по нашему мнению представляется процессор Opteron. Он сохраняет непосредственную совместимость со старым 32-х разрядным ПО, (что может сэкономить значительные средства на приобретение нового ПО), обеспечивая его приличную производительность, а также позволяет провести переход на новую технологию менее болезненно. Возможность в полной мере использовать 32-х разрядное ПО позволяет не опасаться возможных неудач, которые крайне нежелательны при работе не с экспериментальной, но с промышленной системой. Стоит, однако, отметить, что данный процессор еще не появился на рынке, его появление запланировано только на конец первого квартала 2003 года. В то же время уже существуют вычислительные системы, построенные на основе его конкурента Itanium 2. Например, система HP rx5670, занимающая 42-ю позицию в TOP500: 545 процессоров Itanium 2, производительность 1 090 Гфлоп (пиковая – 1 962 Гфлоп). Решение на новых 64-х разрядных процессорах сопровождается определенными рисками, поэтому нужно определить, действительно ли используемым приложениям необходима 64 разрядность.