Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
45
Добавлен:
02.05.2014
Размер:
1.44 Mб
Скачать

9. Озу современных эвм

Увеличение частоты работы процессоров, разрядности шины данных требует повышения быстродействия обмена МП с ОЗУ и уменьшения величин задержек при циклах записи и чтения. Это способствует разработке новых элементов памяти, увеличению емкости ОЗУ, пропускной способности, разрядности системных шин и совершенствованию принципов хранения и передачи данных.

Так, ЭВМ с процессорами PentiumII/IIIс 64-битной ШД,FSB133 Мгц,AGP4x, как показано в табл. 3.4 и 3.5, уже не может обеспечивать наивысшей производительности с основной памятью типаFRM,EDOи дажеCDRAM66 МГц.

Таблица 3.4

Оценка пропускной способности устройств ЭВМ

Узлы ЭВМ

Пиковая пропу­скная способ­ность, Мб/с

Средняя пропу­скная способ­ность, Мб/с

Примечание

Pentium II/III с FSB 133 Мгц

1024

250

при 93 % попадании

в кэш

AGP4x

1024

200

Размер кадро­вого

буфера 8 Мб

PCIна 33 Мгц

132

66

Итого

2180

516

Поэтому новые материнские платы с FSB133 Мгц и выше используют или усовершенствованное ОЗУ, или новую память фирмыRambus[14]. Одним из способов повышения производительности динамической памяти является размещение статической кэш-памяти прямо в кристалле памяти. Такая двухступенчатая память применяется в некоторых моделях ПК, серийно выпускается на ИС CDRAM (Cached DRAM) – продуктах фирм Mitsubishi и Samsung. Микросхемы CDRAM емкостью 4 и 16 Мбит имеют 16 Кб кэш статической памяти со 128-битной внутренней шиной данных.

Таблица 3.5

Характеристики различных типов памяти

Тип

памяти

Частота

Шины,

МГц

Разрядность шины памяти, бит

Максимальная пропускная способность, Мб/с

FRM DRAM

EDO DRAM

SDRAM

Direct RDRAM

SLDRAM

DDR SDRAM

DDR II SDRAM

25,33

40,50

66,100,133

400,600,800

400,600,800

100,133

100,133

32

32

64

16

16

64

64

100,132

160,200

528,800,1064

1600,2400,3200

1600,2400,3200

1600,2100

3200,4200

Другая разновидность ИС CDRAM – микросхемы EDRAM (Enhanced DRAM) фирмы Ramtron. Микросхемы EDRAM емкостью 4 Мбит имеют 8 Кб кэш статической памяти с разрядностью внутренней шины данных 2048 бит. Память с внутренним кэшем существенно эффективнее обычной комбинации DRAM и вторичного кэша L2, особенно в многозадачных системах, где переключение задач приводит к высокой частоте кэш-промахов.

8.1. ОЗУ фирмы Rambus

В 1995 г. фирма Rumbusinc. предложила новую технологию ОЗУRambusна основе игровых ИС памятиBaseRDRAM, включающих 8-битный высокоскоростной канал обмена. Созданы 2 вида памяти Rambus – RDRAM (Direct RDRAM) и Concurent RDRAM. Вторая отличается высокой эффективностью, что делает приоритетным ее использование в графических станциях и серверах (передача данных с частотой 800 МГц). ВDirectRambusреализована шина, у которой сигналы управления передаются отдельно от данных. Естественно, потребовались модули нового типа, названныеRIMM. Они имеют 184 контакта и рассчитаны на напряжение питания 2.5 В (SDRAM-3.3B), а их емкость составляет 64/128/256 Мб. Первоначально планировалась поддержка 3RIMM, но из-за технологических проблем было принято решение о поддержке 2 модулейRIMM, что уменьшило физическую длину шины и увеличило ее надежность, однако ограничило память емкостью 512 Мб.

Технология Direct RDRAM включает структуру, состоящую из основного контроллера, интерфейса и каналов Rambus, к которым подключаются ИС, а так же генератора дифференциальных импульсов. Интерфейс Rambus реализован как в чипах RDRAM, так и в связующем их канале Rambus. Структура ОЗУ Rambus показана на рис. 3.18.Каждый каналRambusспособен поддерживать до 32 чиповDirectRDRAMи пере­давать данные к контроллеру памяти на частоте синхронизации шины 400 МГц автономно. К оконечной ИС канала для исключения искажения сигналов подключается согласующее устройство (терминатор).

ШД Rambus-канала 16-битная (18-ти с режимомECC), ШУ 8-разрядная, ША 8-битная. Передача адреса ячейки осуществляется последовательно по отдельным шинам для передачи адреса строки и столбца, причем адрес может передаваться параллельно с данными. Для выборки данных в ОЗУ используется конвейерный режим. Контроллер работает на частоте до 200 Мгц, что вполне достаточно как для 200 МГц системной шины К7AMD, так и для 133 МГц шиныPentiumIII600.

Рис. 3.18. Схема организации RDRAM

Согласно спецификации, емкость одного чипа RambusDRAMсоставляет 64, 128, 256 Мбит или 1 Гбит. Использование 9-го бита к байту емкостиRambusоставляет производи­телю материнских плат право выбора: либо для введения контроля ЕСС, либо для увеличения общей емкости ОЗУ. Таким образом, появились, соответст­венно, 72 и 144 Мбит варианты ИС.

Тактовая частота RDRAM– 400 МГц, но обмен данными осуществляется на переднем и заднем фронтах синхросигнала, в результате передача данных эквивалентна частоте обмена 800 МГц. Это в сочетании с двумя шинами передачи дан­ных шириной по байту и дает нам пиковую пропускную способность чипаRDRAMв 1.6 Гб/с, в 8 раз превосходящую соответствующее значение чипаPC100SDRAM.

Для упрощения чипа ИС RDRAMнаделены лишь микрооперациями ответа на запросы, генерируемые контроллером памя­ти. Каждый контроллер содержитRambus– интерфейс, лицензированный практически всеми крупными производи­телями ИС. Контроллер ИС может располагаться при необходимости на плате модуляRIMMили в чипе чипсета.

У технологии Rambusесть недостатки, влияющие на длину задержек при выполнении циклов чтения/записи. Так, при операции записи, следующей за чтением, требуется выдержать паузу в зависимости от длины каналаRambus: для короткого канала она может составить всего один такт, 2.5 нс, тогда как в худшем случае пауза может составлять 5 тактов, что соответствует задержке равной 12.5 нс. Существуют задержки, возникающие при организации циклов микрооперациями обмена, перехода с одного режима на другой.

Для уменьшения энергопо­требления питание всех чипов RDRAMуменьшено с 3.3 В, потребляемых чипамиSDRAM, до 2.5 В. Для этих же целейRDRAMимеет 4 режима работы: активный (active), надежный (standby), спящий (nap) и режим с пониженным потреблением энергии (powerdown). Каждый из них харак­теризуется определенным энергопотреблением и временем задержки для выполнения операции передачи данных. Обычно механизмы управления пита­нием переводят устройства в спящий режим тогда, когда в них нет особой нужды. Однако, чтобы не допустить перегрева, чипRDRAMже впадает в спячку во время интенсивной работы - игр, тестов, проигрывания потокового видео или аудио и т.д. Для уменьшения перегрева системы в отсутствии запросов основным режимом для всех чиповRDRAM, является режимStandby. Для включения в работу неактивного чипаRDRAMтребуется порядка 100 нc. и при переходе к активной работе пропускная способность ОЗУ может составлять только 100 Мб/с.

С каждой стороны платы модуля RIMMможет располагаться до 8 чиповRDRAMемкостью по 64 Мбита, что соответствует модулю на 128 Мб. Таких модулей на материнской плате через разъемы может подсоединяться до трех.

Архи­тектура двух каналов Rambusобеспечивает необходимую для МПPentium4 максимальную скорость пере­дачи данных – 3.2 Гб/с. Однако быстродействие обмена существенно зависит от задержек при выполнении операций чтения/записи и их интенсивности.

8.2. Пакетное ОЗУ SLDRAM

В начале 1997 г. 12 производителей различных фирм объединились, чтобы создать более дешевую, чем DirectRDRAM, быстродействующую память емкостью 16, 64, 256 Мб для использования в ПК. Память нового типа с протоколом передачи данных на тактовой частоте более 400 Мгц получила названиеSLDRAM(SyncLinkDRAM). ТехнологияSLDRAMпредставляет собой следующий эволюционный шаг в развитии классического ядраDRAM.

В SLDRAMиспользуется 16-разрядная шина данных, работающая на тактовой частоте 400 МГц [4]. АналогичноDDRSDRAMиRDRAM, передача данных осуществляется на обоих фронтах тактового сигнала и пропускная способностьSLDRAMсоставляет 16 бит400 МГц2 = 1.6 Гб/с. Она может быть увеличена за счет повышения тактовой частоты и разрядности (до 64 бит) системной шины памяти.

В SLDRAMиспользована основательно переделанная архитектура синхронной памяти: адреса, команды, сигналы управления передаются в пакетном режиме по однонаправленной шине. Одновременно с ними по другой двунаправленной шинеDataLinkв пакетном режиме передаются данные. Величина всего пакета может равняться странице. Так как пропускная способность обеих шин одинакова, то переключение на любую страницу ОЗУ осуществляется без потери производительности.

Набор команд у SLDRAMувеличен, что облегчает работу контроллера. Команда представляет собой четыре 10-битных пакета и содержит всю информацию о массиве данных для проведения следующей операции в ОЗУ, что повышает производительностьSLDRAM.

8.3. Синхронное динамическое ОЗУ на 100 и 133 МГц

При переходе с тактовой частоты шины 66 МГц на 100 МГц к ОЗУ SDRAMстали предъявлять более жесткие требования. В соответствии со стандартомIntelразработала спецификацию микросхем памяти, получившую названиеPC100. Микросхемы памятиPC100SDRAMвыпускаются в тонком малогабаритном корпусеTSOP, где количество выводов ИС определяется глубиной адресного пространства микросхемы.

На основе этих микросхем изготовлены модули DIMMемкостью до 1Гб и модулиRDIMM(Registerd) емкостью 1 Гб и более с буферным ОЗУ. Варианты модуляDIMMпредставлены в табл. 3.6. Организация ШД в 72 бита используется дляDIMMс контролем ОЗУ в режимеEСС.

Таблица 3.6

Конфигурация модулей PC100SDRAM

Емкость модуля, Мб

Организация модуля

Емкость микросхемы SDRAM, Мбит

Организация микросхемы SDRAM

Количество микросхем SDRAM

128

128

256

256

512

512

1024

16 Mx64

16 Mx72

32 Mx64

32 Mx72

64 Mx64

64 Mx72

128 М х 72

64

64

128

128

256

256

256

8 Mx8

8 Mx8

16 Mx8

16 Mx8

32 Mx8

32 Mx8

64 М х 4

16

18

16

18

16

18

36

С увеличением тактовой частоты системной шины до 133 МГц появились микросхемы PC133SDRAM. Задержки уPC133 на четверть меньше, чем уPC100. На подготовку к процедуре чтения или записиPC100 илиPC133 потребуется 3 такта, что дляPC100 займет 30 (310) нс, а для РС133 – 22.5 (37.5) нс. Для сравнения: величина задержки при переходе из пассивного режима в активныйPC100 иPC133 меньшеRDRAM, где она равна 57.5 (232.5) нс.

Как видно из табл. 3.5, PC133 по пиковой пропускной способности проигрывает дажеDirectRDRAM600 МГц - 1064 Мб/с против 2.4 Гб/с. Она также проигрывает по реальной и средней пропускной способности примерно 650 Мб/с против 840 Мб/с.

Если исходить из требуемой пиковой пропускной способности, то до нее не хватает и DirectRDRAM800 МГц. Если смотреть на среднюю, то она обеспечиваетсяPC100SDRAM. Из табл. 3.4. видно, чтоPC133SDRAMудовлетворяет максимальные требования как сис­темной шины с частотой 133 Мгц, так иAGP4х.

8.4. ОЗУ с удвоенной скоростью передачи данных DDR SDRAM

Дальнейшее совершенствование SDRAM(PC66, 100, 133) способствовало разработке архитектуры ОЗУ с удвоенной скоростью передачи данныхDDRSDRAM(SDRAMII), где можно передавать по одному проводу 2 бита данных за такт [4]. В ней добавлена ассоциация каналов памяти с процессами системы. Это увеличивает пиковую пропускную способность до 1.6 Гб/с при частоте шины 100 МГц.

Этот тип памяти основан на тех же принципах, что и SDRAM, но включает в себя ряд весьма существенных возможностей. ВDDRSDRAMисполь­зуется синхронизация по переднему и заднему фронту, отсутствующая вSDRAM, и цикл с фиксированной за­держкойDLLдля выдачи сигналаDataStrobe, означающий доступность данных на выходных контактах. Используя один сигналDataStrobeна каждые 16 вы­водов, контроллер может осуществлять доступ к данным более точно и син­хронизировать входящие данные, поступающие из разных массивов, находя­щихся в одном банке.

Хотя частота кристалла остается прежней, обмен данных в DDRSDRAMосуществляется на обеих фронтах сигнала, что увеличивает вдвое пиковую пропускную способность по сравнению сSDRAM, работающей на базовой частоте. Так, если за базовую принять частоту 100 МГц, то уDDR200, пиковая пропускная способность которой 1.6 Гб/c, будет вдвое больше чем уPC100SDRAMи составитDirectRambusDRAM800 МГц.

Стандартом предусмотрена частота 133 МГц и чипы DDR266, у которых пиковая пропускная способность составляет 2.1 Гб/с.DirectRDRAMуступает ей как по пропускной способности, так и по задержкам при переходе с режима на режим (табл. 3.7.)

Модуль DIMMDDR200 потреб­ляет примерно столько же мощности, сколько и модульPC100 той же емкости. Однако имеет 184 контакта против 164 контактовDIMMSDRAM. Это приводит к необходимости установки на материнской плате специальных разъемов.

Таблица 3.7

Характеристики DDR266 иDirectRDRAM800

Параметр

DDR266

Direct RDRAM

Пиковая пропускная способность (Гб/с)

2.1

1.6

Эффективность работы шины памяти (%)

65

85

Эффективная пропускная способность (Гб/с)

1.37

1.36

В конце 2000 г. была разработана память DDRSDRAMс результирующей частотой 500 МГц, с учетом 128-битной шины пропускная способность составила 8 Гб/с.

В 2003 г. планируется производство нового поколения DDRIIс более низким напряжением питания 1.8Bвместо 2.5 В, в котором за один такт будут передаваться 4 пакета данных. Пропускная способность этой памяти на тактовой частоте 100 МГц при 64-разрядной шине составит 3.2 Гб/с.

8.5. ОЗУ с виртуальными каналами обмена

Кроме увеличения частоты обмена, существуют другие спосо­бы повысить интенсивность работы SDRAM. Один из них – использование техноло­гии обмена с виртуальным каналомVCM, разработанной фирмойNEC. В основеVCMлежит принцип снижения длительности задержки в обмене данными за счет увеличения числа каналов обмена с разными областями ОЗУ, а также снижение энергопотребления модулей памяти. Добиться выполнения этой задачи удалось следующим образом.

В обычном ОЗУ для обмена данными по ШД любым системным устройствам (контроллеры PCI,IDEилиAGP, кэш МП) менеджер памяти делает запрос, включающий адрес, размер блока данных и т.д., как показано на рис. 3.19. Причем если все эти действия ведутся одновременно несколькими устрой­ствами, то выполнить обмен данными по этим запросам невозможно из-за наличия только одного буфера обмена ОЗУ с системной шиной.

В VCMкаждому устройству назначается свой высокоскоростной виртуальный канал, учитывающий специфические характеристики его запросов, в том числе и обеспечивающей функции кэширования. Менеджер памяти закрепляет устройства обмена ЭВМ за конкретными каналами, которым выделяется область ОЗУ и индивидуальные или смежные банки памяти. Затем он посылает каналу команду на запись или чтение, а каждый канал, включающий все необходимые микрооперации, такие как задержки между циклами, вычисление адресов блоков и т.д., занимается индивидуальным обменом. В результате внешние и внут­ренние операции оказываются независимыми друг от друга и могут исполняться параллельно. Эффективность доступа к памяти значительно повышается. Причем при необходимости можно увеличить число виртуальных каналов, обслуживающих одно устройство ЭВМ. Так,AGPможет использовать каналы для загрузки текстур, расчета фигур, цвета и др.

Рис. 3.19. Структура обмена устройств ЭВМ с ОЗУ

Конструктивно, как показано на рис. 3.20, каждый виртуальный канал (ВК) включает ИС в виде буферной памяти SRAMемкостью 1 024 бит и располагается между линией ввода/вывода памяти и матрицей ячеек памяти. В буферной памяти осуществляется временное хранение данных, что позволяет с учетом разных банков осуществлять регенерацию памяти и циклы чтения/записи данных одновременно. Обмен данными между буфером виртуального канала и ячейками банка ОЗУ происходит блоками емкостью по 1 024 бита. Содержимое буфера канала затем участвует в интенсивных передачах системной шины.

По данным NEC, увеличение эффективности может достичь 90 %, а по тестамVCM133SDRAMпревосходит РС133 на 10 – 30 %. Кроме того, уменьшается энергопотребление примерно на 30 % за счет того, что в тот момент, когда происходит передача результатов приказа сис­темному устройству, участвующему в обмене, вся фоновая активность по другую сторону виртуально­го канала может быть заморожена.

По вы­водам чипы VCMаналогичны обычным чипамSDRAM, совмес­тимы с ними и по используемому интерфейсу.BIOSможет легко распо­знать модулиVCM. Модули, взаимозаменяемые с обычнымиSDRAMDIMM, причем все последние чипсеты отSiSиVIAподдерживаютVCM. Увеличение площади чипа по сравнениюSDRAMсоставляет всего 1 – 3 %, незначительно отличается и себестоимость РС133SDRAM.

VCMне критичен к типу памяти и легко мо­жет быть в дальнейшем встроен, например, вDDRSDRAM.

Рис. 3.20. Архитектура виртуального канала

В табл. 3.8 приведены модели компьютеров, использующих новые типы ОЗУ емкостью 256 Мб.

Таблица 3.8

Компьютеры с ОЗУ 256 Мб

Модель

Центральный процессор

Тип ОЗУ

Видеоплата

Процессор

Память (Мб)

GatewayPerfomance 1500

Pentium 4-1500

RDRAM

nVidia GeForce2 Ultra

64 DDR SDRAM

Dell Dimension 8100

Pentium 4-1500

RDRAM

nVidia GeForce2 GTS

IBM NetVista P4

Micron Millennia Max

Athlon1200

DDR SDRAM

One system

Athlon1100

PC133 SDRAM

Gateway Perfomance 1000

Pentium III-1000

HP Pavilion

Pentium III-1000

149

Соседние файлы в папке Дубинин Н.М. Организация ЭВМ и Систем