Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
современные СВТ.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
284 Кб
Скачать

19

Содержание:

Введение…………………………………………………………………3

1.Структурная схема ЭВМ……………………………………………...4

1.1. Выбор и описание центрального процессора………………….….6

1.2. Выбор и описание материнской платы, оперативной памяти, жестких дисков и видеоадаптера…………………………………………………10

2.Рассчет производительности ЭВМ…………………………………...14

2.1. Оценка быстродействия ЭВМ смесью Гибсона…………………..14

2.2. Производительность в синтетических тестах……………………..16

Заключение……………………………………………………………….18

Список литературы………………………………………………………19

Введение.

Люди учились считать, используя собственные пальцы. Когда этого оказалось недостаточно, возникли простейшие счётные приспособления. Особое место среди них занял АБАК, получивший в древнем мире широкое распространение. Затем спустя годы развития человека появились первые электронные вычислительные машины (ЭВМ). Они не только ускорили вычислительную работу, но и дали толчок человеку для создания новых технологий. Слово «компьютер» означает «вычислитель», т.е. устройство для вычислений. Потребность в автоматизации обработки данных, в том числе вычислений, возникла очень давно. В наше время трудно представить себе, что без компьютеров можно обойтись. А ведь не так давно, до начала 70-х годов вычислительные машины были доступны весьма ограниченному кругу специалистов, а их применение, как правило, оставалось окутанным завесой секретности и мало известным широкой публике. Однако в 1971 году произошло событие, которое в корне изменило ситуацию и с фантастической скоростью превратило компьютер в повседневный рабочий инструмент десятков миллионов людей. В том, вне всякого сомнения знаменательном году ещё почти никому не известная фирма Intel из небольшого американского городка с красивым названием Санта-Клара (шт. Калифорния), выпустила первый микропроцессор. Именно ему мы обязаны появлением нового класса вычислительных систем – персональных компьютеров, которыми теперь пользуются, по существу, все, от учащихся начальных классов и бухгалтеров до учёных и инженеров. В конце XX века невозможно представить себе жизнь без персонального компьютера. Компьютер прочно вошел в нашу жизнь, став главным помощником человека. На сегодняшний день в мире существует множество компьютеров различных фирм, различных групп сложности, назначения и поколений.

В данной курсовой работе будет спроектирована современная вычислительная машина и рассчитана её производительность.

1.Структурная схема эвм.

В данном пункте приведена схема вычислительной машины в общем виде (рис.1.1).

Рис.1.1. Структурная схема ЭВМ

Данная схема состоит из центрального процессора, который будет рассматриватсья далее. Чипсета, подключенного напрямую к центральному процессору через фронтальную шину. Чипсет – набор микросхем, спроектированных для совместной работы с целью выполнения набора заданных функций. Чипсет обеспечивает взаимодействие центрального процессора с перефирийными устройствами. Чаще всего чипсет материнских плат современных компьютеров состоит из двух основных микросхем (иногда объединяемых в один чип – системный контроллер-концентратор (англ. System Controller Hub, SCH)).

Контроллер-концентратор памяти (Memory Controller Hub) или северный мост (northbridge) – обеспечивает взаимодействие ЦП с памятью. Соединяется с ЦП высокоскоростной шиной (FSB, HyperTransport или QPI). В современных ЦП (например intel core 6-го поколения) контроллер памяти может быть интегрирован непосредственно в ЦП. В MCH некоторых чипсетов может интегрироваться графический процессор.

Контроллер-концентратор ввода-вывода (I/O Controller Hub) или южный мост (southbridge) – обеспечивает взаимодействие между ЦП и жестким диском, картами PCI, низкоскоростными интерфейсами PCI Express, интерфейсами IDE, SATA, USB и т.д. Иногда в состав чипсета включают микросхему Super I/O, которая подключается к южному мосту по шине Low Pin Count и отвечает за низкоскоростные порты: RS232, LPT, PS/2.

Low Pin Count (LPC bus) – шина, используемая в IBM PC-совместимых персональных компьютерах для подключения устройств, не требующих большой пропускной способности к ЦПУ. К таким устройствам относятся загрузочное ПЗУ(BIOS) и контроллеры «устаревших» низко производительных интерфейсов передачи данных, такие, как последовательный и параллельные интерфейсы, интерфейс подключения манипулятора «мышь» и клавиатуры, НГМД, а с недавнего времени и устройств хранения криптографической информации. Обычно контроллер шины LPC расположен в южном мосте на материнской плате.

Super I/O (Super Input/output) – название класса сопроцессоров, которые начали использоваться после 1980-х годов на материнских платах IBM PC-совместимых компьютеров путём сочетания функций многих контроллеров, сперва одной платой, устанавливаемой в слот расширения, а затем и одной микросхемой, тем самым достигая уменьшения числа микросхем контроллеров, и таким образом привели к снижению сложности и стоимости компьютера в целом. Super I/O объединяет интерфейсы различных низкочастотных устройств.

1.1. Выбор и описание центрального процессора.

Исходя из варианта задания, проектируемая система, должна быть построенна на процессоре AMD FX-8150. Данный процессор один из первых процессоров серии FX. Был представлен компанией AMD в 2011 году. Данный процессор создавался для настольного сегмента и имеет следующие технические характеристики (см. табл.1.1).

Таблица 1.1. Технические характеристики AMD FX-8150

Архитектура

Bulldozer

Ядра/модули

8/4

Частота (штатная/turbo)

3,6 ГГц / 4,2 ГГц

Кэш L1

16 кбайт

Кэш L2

2 Мбайт

Кэш L3

8 Мбайт

TDP

125 Вт

Частота шины памяти

До 1866 МГц

Тип разъёма процессора

АМ3+

Техпроцесс

32 нм

Bulldozer – кодовое название новой процессорной архитектуры процессоров AMD64 (в рамках системы команд x86) от компании AMD, семейства 15h, изготавливаемых по 32-нм технологии и предназначенных для серверов и высокопроизводительных ПК.

Процессоры Bulldozer, по заверениям представителей AMD, имеют полностью новую архитектуру по сравнению с предыдущими поколениями AMD K8 и AMD K10. Известно, что процессоры Bulldozer впервые поддерживают новые инструкции x86 (SSE4.1, SSE4.2, CVT16, AVX и XOP, в том числе 4-операндный модуль FMAC). Bulldozer содержат до 8 ядер для настольного сегмента, до 16 ядер – для серверного, и обладают совместимостью с модульной процессорной архитектурой M-SPACE. Введена поддержка новой версии технологии AMD Direct Connect и четырёх каналов HyperTransport 3.1 на каждый процессор. Возможность работы с памятью DDR3 и технологией расширения памяти AMD G3MX позволяет увеличить пропускную способность процессора. Также улучшено управление питанием.

Новые процессоры получили поддержку технологии Turbo Core 2, которая позволяет увеличить номинальную частоту процессора с 3,5 до 4 ГГц и заметно повысить производительность аналогично технологии Intel Turbo Boost.

У серверных процессоров Bulldozer существует поддержка сверхъёмких модулей оперативной памяти LR-DIMM, реализованная в их интегрированных контроллерах памяти.

Структурная схема архитектуры Bulldozer приведена на рис.1.2.

Рис.1.2. Структурная схема архитектуры Bulldozer

Данная схема включает в себя контроллер Misc IO для выполнения элементарного набора команд, упакованных в одну связку. Двунаправленная высокоскоростная шина HyperTransport для соединения между собой процессорных ядер, контроллер оперативной памяти DDR3 PHY, 4 блока по 2 ядра BD core, сверхоперативную память L2 и L3. Схема ядра приведена на рисунке 1.3.

Рис.1.3. Схема ядра Bulldozer

Основное отличие Bulldozer от других актуальных процессорных микроархитектур заключается в компоновке x86 ядер, которые теперь попарно расположены в одном «модуле» и делят между собой остальные ресурсы – блок вещественных вычислений (FPU), кэш второго уровня (L2) и так называемый «front end», о последнем будет рассказано ниже. Таким образом, каждый модуль новой микроархитектуры является чем-то средним между обычным двухъядерным CPU и процессорным ядром с Hyper-Threading.

В некотором смысле это даже развитие идеи Hyper-Threading, но в отличие от неё, где два потока «разбивают» то же количество аппаратных ресурсов, в модуле Bulldozer два потока часть ресурсов делят, а часть - получают в единоличное пользование. Но баланс подобран грамотно, все «тяжёлые» и «дорогие» (с точки зрения транзисторного бюджета) блоки распределяются между двумя ядрами, а сами х86 ядра дублируются, поскольку тратится на каждое из них всего лишь около 12% общего числа транзисторов в модуле.

С точки зрения выполнения целочисленных и адресных операций каждый модуль представляет собой два полноценных и независимых ядра, между которыми при вещественных вычислениях делятся ресурсы FPU. Эти же ядра по факту и обслуживают FPU, отправляя ему инструкции на исполнение, загружая и выгружая данные, храня и отставляя МОПы, поскольку именно к ним привязаны вычислительные потоки, механизмы внеочередного исполнения команд и кэши данных первого уровня (L1D).

Очевидно, что основное преимущество данной схемы перед одним ядром - в повышенной производительности при многопоточной нагрузке, особенно с упором на целочисленные вычисления. Попробуем рассмотреть основные блоки Bulldozer подробнее.

«Front end» представляет собой набор логических устройств, обеспечивающих подготовку инструкций для исполнения на вычислительных устройствах. В него входят блоки предсказания переходов, точность работы которых влияет на то, как часто будет простаивать CPU в процессе ожидания передачи нужных данных из оперативной памяти или кэшей, кэш инструкций первого уровня (L1I) и декодер, который занимается «переводом» х86 инструкций в понятный для исполнительных устройств вид - МОПы.

Изменения, которые коснулись этих блоков, неоднозначны. С одной стороны, повысилась точность предсказаний переходов. При декодировании из кэша данные считываются порциями в 32 байта, как у K10, что хорошо и вдвое больше, чем у Sandy Bridge. Инструкции теперь перерабатываются четырьмя каналами, а не тремя, как в K7-K10. И это одно из самых важных и долгожданных улучшений в микроархитектуре. Но AMD только сейчас внедрила четырёхканальный декодер, в то время как у Intel он появился пять лет назад, в Conroe (Core2). При этом кэш инструкций фактически того же размера и ассоциативности (64 Кбайта, 2-way), что и в K10, куда он перекочевал без особых изменений ещё с K7.

Также не стоит забывать, что теперь и кэш инструкций, и декодер будут нужны не одному, а двум потокам, так что их возможности можно условно разделить пополам при интенсивной многопоточной нагрузке. Резюмируя, можно сказать, что новый «front end» выглядит в чём-то лучше, а в чём-то хуже, чем у предшественников, и будет демонстрировать свою силу и слабость в зависимости от характера задачи.

Ядра х86 в количестве двух штук на модуль, являются как раз той самой отличительной особенностью Bulldozer'a и позволяют одному модулю обрабатывать два потока инструкций. По сути, в них сосредоточены основные устройства х86 ядер с механизмом внеочередного исполнения команд (Out-of-Order Execution), а именно – буфер МОПов, поступивших с декодера (Sheduler), устройство отставки выполненных инструкций (Retire), сами целочисленные исполнительные устройства и устройства генерации адреса (ALU и AGU), по две штуки на х86 ядро, а также кэш данных первого уровня (L1D) и устройство загрузки выгрузки (LSU).

Во многом, х86 ядро Bulldozer напоминает целочисленный блок K10, но налицо ряд заметных и неоднозначных изменений. Во-первых, количество ALU и AGU сократилось с трёх до двух, по сравнению с K10. С одной стороны, это падение пиковой теоретической производительности в полтора раза, с другой, выжать её на практике практически невозможно, так что потеря не велика, хоть и есть. Во-вторых, кэш данных стал в четыре раза меньше, чем у K10, 16 Кбайт вместо 64 Кбайт, но зато его ассоциативность выросла с двух путей до четырёх. Так что можно назвать это оправданным разменом объёма на скорость.

Ну а LSU стал лучше во всём, как номинальная, так и эффективная вместимость буферов существенно выросла, а разрядность операций записи увеличена в два раза.

Подсистема кэшей также претерпела несколько важных изменений, по сравнению с K10. Как уже упоминалось, кэш данных первого уровня (L1D) разменял объём на ассоциативность, а кэш инструкций (L1I) остался фактически без изменений. Кэш второго уровня (L2), который раньше единолично использовался одним ядром, теперь является общим для двух х86 ядер модуля. Кроме того, объём L2 кэша вырос с 512 Кбайт до 2 Мбайт, по сравнению с K10. Уровень ассоциативности остался тот же, 16-way.

Это значит, что в восьмиядерном, четырехмодульном ЦП с микроархитектурой Bulldozer используется четыре кэша второго уровня суммарным объёмом 8 Мбайт. Но, скорее всего, рост объёма и необходимость делить ресурсы между двумя ядрами также наложили отрицательный отпечаток на время доступа к кэшу второго уровня. Кэш третьего уровня и контроллер памяти, подобно K10, работают на своей частоте, более низкой, чем частоты модулей. Для анонсированных процессоров она составляет 2-2.2 ГГц, в зависимости от модели. Это меньше, чем у Sandy Bridge, где интегрированный контроллер памяти и L3 кэш работают на частоте ядра. Объём кэша третьего уровня у Bulldozer, составляет теперь 8 Мбайт, а его ассоциативность 64-way, что на треть больше, чем у Deneb (6 Мбайт и 48-way соответственно).

Стоит также напомнить, что кэш у процессоров AMD организован по так называемой эксклюзивной схеме, когда данные в кэшах разных уровней не дублируются и суммарный объём их всех можно считать и эффективным. Подводя итоги по кэшам, скажу, что изменения в L1 и L2 существенные, но неоднозначные, а L3 выглядит логичным развитием наработок K10.

Контроллер памяти ЦП AMD FX не претерпел существенных изменений, он по-прежнему двухканальный, а штатно поддерживаемая частота модулей памяти DDR3 увеличилась до 1866 МГц.

Что же можно сказать, подводя итоги по новой микроархитектуре? Как уже было показано выше, изменений очень много, все они глубокие и неоднозначные. Нет сомнений, что Bulldozer - новая микроархитектура AMD. Это же означает, что показать она себя может также очень неоднозначно, продемонстрировав местами производительность чуть ниже, чем у K10, а местами значительно больше.

Тем не менее, с точки зрения поддержки современных наборов команд и технологий автоматического повышения частот, ориентированности на многопоточную нагрузку, новая разработка AMD не уступает конкурирующей – Sandy Bridge, а в ряде случаев смотрится даже выгоднее. И хотя заметно, что у Bulldozer есть целый ряд слабых мест, они легко могут быть устранены в будущем.