Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Duisembiev-Parallel-esep.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
5.86 Mб
Скачать

28 Сурет. Hewlett Packard Superdome компьютері

ұяшықтарының құрылымы.

Superdom компьютерінің ұяшық архитектурасында басты орынды ұяшық бақылаушысы (контроллер) алады. Бақылаушы - құрамында 24 миллион транзисторы бар күрделі құрылғы. Ұяшықтың әрбір процессоры үшін бақылаушыда өзінің арнайы порттары бар. Әрбір процессор мен контроллер арасындағы деректермен алмасу жылдамдығы 2 Гбай/с. Ұяшықтың жадысы 2 - 16 Гбайт құрайды. Ол әрқайсысының ұяшық бақылаушысында өз порты бар 2 банкаға бөлінген. Контроллер мен әрбір банк арасындағы ақпаратты (деректерді) алмасу жылдамдығы 2 Гбайт/с.

Ұяшық бақылаушысының бір порты әрқашан сыртқы коммутатормен байланысқан. Ол ұяшық процессорларын жүйедегі басқа процессорлармен алмастыру үшін қажет. Бұл порттың жұмысының жылдамдығы 8 Гбайт/с.

Процессор, жады басқа ұяшықтар және сыртқы орта арасындағы интерфейстік функцияларын (қызметтерін) орындай отырып, ұяшық контроллері процессорлардың кэш жадысының когеренттігіне де жауап береді.

Ұяшық – бұл компьютердің төрт процессорлық базалық блогы. Superdome компьютерінің 64 процессорлы конфигурациясы әрбірінде 32 процессоры бар 2 бағаннан тұрады (29 сурет).

ұяшық

1 Баған 2 Баған

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

ұяшық

29 Сурет. Hewlett Packard Superdome компьютерінің

жалпы құрылымы.

Әрбір бағанның құрамында 2-ден сегізпортты бұғаттамайтын коммутаторлар бар. Коммутаторлардың барлық порттары 8 Гбайт/с жылдамдықпен жұмыс істейді. Әрбір коммутаторға төрт ұяшықтан қосылады (жалғанады). Коммутатордың 3 порты жүйедегі басқа коммутаторлармен байланысын іске асырады (біреуі осы бағанда, екі коммутатор келесіде). Қалған порты Hewlett Packard Superdome компьютерінің басқа жүйелерімен байланыс жасау үшін сақталып қойылған, яғни бұл компьютердің процессорларының жалпы саны 64-тен көп болатын көпторапты конфигурациясын құрастыру мүмкіндігін береді деген сөз.

ссNUMA архитектуралы кезкелген есептеу жүйесінің басты сұрақтарының бірі, процессордың жергілікті және қашықтағы жадыға қатынасы кезіндегі уақыт айырмашылығы болып табылады. Әрине, SMP – компьютеріндегі сияқты бұл айырмашылықтың мүлде болмағаны дұрыс болар еді. Бірақ бұл жағдайда жүйе нашар масштабталатын болады. HP Superdome компьютерінде процессордың жадыға қатынасы кезінде үш түрлі бөгелістер болуы мүмкін:

  • процессор және жады бір ұяшықта орналасады; бұл жағдайда бөгеліс минималды;

  • процессор және жады әртүрлі ұяшықтарда орналасады, бірақ бұл екі ұяшық та бір коммутаторға жалғастырылған;

  • процессор және жады әртүрлі ұяшықтарда орналасады, және бұл екі ұяшық әртүрлі коммутаторларға жалғастырылған; бұл жағдайда сұраныс екі коммутатор арқылы өтуі тиіс және бөгелістер максималды болады.

Әрине, бұл жерде, бөгеліс шамасы тек қана процессор мен жадының өзара орналасуына ғана емес, сонымен қатар процессорлар санына да байланысты екені түсінікті. Есептеу жүктемесінің сипаты да маңызды параметрлерге жатады. Мысалы, бірмезгілде жұмыс істеп тұрған қолданбалар санына байланысты бөгеліс өзгеруі мүмкін. Бөгелістің процессорлар санына байланысы екі ситуация үшін 1-ші кестеде көрсетілген [9, 13]. Бірінші жағдайда біртарамды қолданбалар, ал екіншісінде көптарамды бағдарламалар жұмыс істейді. Бірінші жағдайдан айырмашылығы, екінші жағдайда процессорлар кэш-жадысы когеренттігіне қолдау көрсету үшін қосымша шығындар пайда болады. Екі жағдайда да кестеде бөгелістің орта көрсеткіштері келтірілген және сұраныстардың жадыға таратылуы бірқалыпты деп есептеледі.

1 кесте. Процессорлар және жүктеулер санына байланысты бөгеліс

Процессорлар саны

Біртарамды бағдарламалар нс

Көптарамды бағдарламалар нс

4

174

235

8

208

266

16

228

296

32

261

336

64

275

360

Көріп отырғанымыздай, 4 процессорлы конфигурациядан 64-процессорлыққа көшкендегі бөгелістің арту коэффициенті бар болғаны 1,6 есе. Яғни, пайдаланушы көп жағдайларда дәстүрлі SMP-компьютерлері үшін құрылған өз бағдарламаларының тиімді іске асырылатынынан үміттенуге болады деп айта аламыз.

HP Superdome компьютері көптеген қызықты ерекшеліктерге ие. Мысалы, компьютердің бағдарламалық-аппараттық ортасы оны әртүрлі баптауға мүмкіндік береді. Hewlett Packard Superdome компьютерін әртүрлі бірнеше операциялық жүйелермен жұмыс істейтін (HP UX, Linux, Windows 2000) бір-біріне тәуелсіз бөлімдердің жиыны ретінде де құрастыруға болады. HP Superdome компьютері архитектурасының ерекшеліктерімен таныса отырып, ондағы пайдаланылатын РА-8700 процессорының құрылымын қысқаша қарастырып өтейік. Егер біз тұтас жүйені тиімді пайдаланғымыз келсе, онда оның базалық компоненттерінің ерекшеліктері туралы жалпылама түрде болса да түсінігіміз болуы қажет.

Процессордың тактілік жиілігі 750 МГц. Максималды жүктелу кезінде ол бір тактіде төрт арифметикалық амал орындай алады. Бұл екі параметр оның шектік өнімділігінің мәнін анықтайды – 3 Гфлопс. Бұдан базалық 64-процессорлы HP Superdome компьютерінің шектік өнімділігі алынады – 192 Гфлопс.

РА-8700 процессорының архитектурасы суперскалярлық. Ол әрбір тактіде кодтың ақпараттық құрылымы қанша операция орындауға мүмкіндік бере алса сонша орындайды және де осы мезетте қанша функционалдық құрылғы қолжетімді болса соншама орындайды. РА-8700 процессоры барлығы 10 функционалдық құрылғыдан тұрады: төрт құрылғы бүтін санды арифметика және логика үшін, төртеуі нақты арифметикамен жұмыс істеуі үшін, екі құрылғы оқу/жазу операциясы үшін. Әрбір тактіде командаларды таңдау құрылғысы кэш-жадыдан 4 команданы оқи (считывает) алады. Процессордың кэш-жадысының көлемі 2,25 Мбайт, оның 1,5 Мбайты кэш деректерге бөлінсе, қалған 0,75 Мбайт – ол командалар кэші.

Жалпы HP Superdome компьютерлерінің пайдаланылу облысы өте кең. Россияны алатын болсақ, ғылыми-техникалық есептерді шешуге арналған 64-процессорлы бір HP Superdome компьютері Межведомствалық суперкомпьютерлік орталықта орналасқан, ал 72-процессорлы екінші компьютер Россияның Сбербанкінде жұмыс істеуде.

Енді ортақ жадылы есептеу жүйелерінің нақты бағдарламалар өнімділігін төмендетуге алып келетін кейбір ерекшеліктерін атап өтейік.

Амдал заңы әмбебап сипатқа ие болғандықтан, ол барлық параллель есептеу жүйелерімен бірге еске алынады. Егер бағдарламада барлық операциялардың 20 % қатаң тізбекті түрде орындалатын болса, онда пайдаланылған процессорлар санына байланыссыз 5-тен көп үдеу алу мүмкін емес (мұнда кэш-жадының әсері қарастырылмайды). Бұны жаңа параллель кодты жобалауда да, ескі тізбекті бағдарламаны осы архитектураға лайықтап келтіру алдында да ескеру керек.

Осы класты жүйелерде жадымен жұмыс істеу өте «ерекше» болып есептеледі. Өнімділікті төмендететін себептердің бірі – жадыға біртекті емес қатынастың болуын біз жоғарыда талдаған болатынбыз. 5-10 % деңгейіндегі біртекті еместік дәрежесі аса қиын мәселелерді тудыра қоймайды. Бірақ, жергілікті және қашықтағы жадыға бірнеше рет қатынаудағы уақыт айырмашылығы, пайдаланушыдан бағдарламалауды өте мұқият жүргізуді талап етеді. Бұл жағдайда оған, таратылған жадылы жүйелер үшін деректерді тарату сияқты сұрақтарды шешуге тура келеді. Басқа себеп – жадыға қатынаудағы қақтығыстар, көптеген SMP-жүйелері үшін де тиесілі.

Әрбір процессордың өз кэш-жадысы болуы да қосымша ерекшеліктерге әкеледі. Оларың ішіндегі аса маңыздысы кэш-жады мазмұнының үйлесімділігін қамтамасыз ету қажеттілігінен тұрады. Осыдан келіп ссNUMA аббревиатурасындағы алғашқы екі әріптің пайда болуы шығады. Бұл мәселені шешуге аппаратура неғұрлым сирек тартылған сайын, бағдарламаның орындалуында соғұрлым шығындар аз болады. Осы себепке байланысты ортақ жадылы көптеген есептеу жүйелерінде процесстерді процессорларға таңатын параллель бағдарламаны орындау режимі бар.

Кезкелген соңғы жылдары шыққан процессордың архитектурасы күрделі болып келеді. Олар жадының бірнеше деңгейін және көптеген функционалдық құрылғыларды біріктіреді. Жеке процессордың нақты өнімділігінің оның шектік өнімділігінен айырмашылығы ондаған есені құрауы мүмкін. Әрбір процессордың мүмкіндігін пайдалану дәрежесі неғұрлым жоғары болған сайын, есептеу жүйесінің жалпы өнімділігі де соғұрлым жоғары болары анық.

Тағы да алдыңғы параграфтағыдай оның өнімділігіне әсер ететін компьютер ерекшеліктерін одан ары жалғастыра беруге болады. Оның бәрі әрбір бағдарламада қандай да бір дәрежеде пайда болады. Осыдан келіп төмен өнімділік мәселелері, пайдаланушылар мәселелері келіп шығады. Әрине, бұл шешілетін мәселелер, бірақ шешудің дұрыс тәсілін таңдау үшін оларды анық түсіну және көрсете алу керек.

Сұрақтар мен тапсырмалар

  1. Бірдей процессорлар базасында құрастырылған екі жүйенің артықшылықтары мен кемшіліктерін атаңыз: ортақ жадылы 16-процессорлы жүйе және 16-процессорлы есептеу кластері.

  2. Ортақ жадылы 16-процессорлы HP Superdome компьютерінің шектік өнімділігі неге тең?

  3. РА-8700/750МГц процессорлары базасында құрастырылған 16-процессорлы есептеу кластерінің шектік өнімділігі неге тең?

  4. Қазіргі заманғы SMP-серверлердің ортақ жадысына қатынасты ұйымдастыру әдістеріне ізденістер жүргізіңіз.

  5. Баға/өнімділік қатынасына қатысты не айта аласыз?

  6. Баға/өнімділік қатынасы жоғары болатын SMP-компьютерлерінде қанша процессор болуы мүмкін? Процессорлардың әртүрлі типі және жүйелер бойынша талдау жасаңыз.

  7. Қазіргі заманғы SMP-компьютерлері үшін арифметикалық операцияларды орындау жылдамдығы және негізгі жадымен алмасу жылдамдығы арасында қандай қатынас орындалады?

  8. Жадыға біртекті емес қатынас туралы не айтасыз?

  9. HP Superdome компьютерінде процессордың жадыға қатынасы кезіндегі бөгелістерді талдаңыз.

  10. HP Superdome компьютерінің архитектурасы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]