- •Глава III. Организация памяти эвм
- •1. Классификация и параметры запоминающих устройств
- •2. Постоянные и полупостоянные запоминающие устройства
- •3. Оперативные запоминающие устройства
- •4. Характеристики обмена и типы оперативной памяти
- •Озу Nx1 a1... А10 wcasras d0 озу Nx1 a1... А10 wcasras d8 озу Nx1 a1... А10 wcasras d0 ... D7 d8
- •6. Логическая организация памяти
- •7. Сегментация памяти
- •8. Страничная организация памяти
- •9. Озу современных эвм
9. Озу современных эвм
Увеличение частоты работы процессоров, разрядности шины данных требует повышения быстродействия обмена МП с ОЗУ и уменьшения величин задержек при циклах записи и чтения. Это способствует разработке новых элементов памяти, увеличению емкости ОЗУ, пропускной способности, разрядности системных шин и совершенствованию принципов хранения и передачи данных.
Так, ЭВМ с процессорами PentiumII/IIIс 64-битной ШД,FSB133 Мгц,AGP4x, как показано в табл. 3.4 и 3.5, уже не может обеспечивать наивысшей производительности с основной памятью типаFRM,EDOи дажеCDRAM66 МГц.
Таблица 3.4
Оценка пропускной способности устройств ЭВМ
Узлы ЭВМ |
Пиковая пропускная способность, Мб/с |
Средняя пропускная способность, Мб/с |
Примечание |
Pentium II/III с FSB 133 Мгц |
1024 |
250 |
при 93 % попадании в кэш |
AGP4x |
1024 |
200 |
Размер кадрового буфера 8 Мб |
PCIна 33 Мгц |
132 |
66 |
|
Итого |
2180 |
516 |
|
Поэтому новые материнские платы с FSB133 Мгц и выше используют или усовершенствованное ОЗУ, или новую память фирмыRambus[14]. Одним из способов повышения производительности динамической памяти является размещение статической кэш-памяти прямо в кристалле памяти. Такая двухступенчатая память применяется в некоторых моделях ПК, серийно выпускается на ИС CDRAM (Cached DRAM) – продуктах фирм Mitsubishi и Samsung. Микросхемы CDRAM емкостью 4 и 16 Мбит имеют 16 Кб кэш статической памяти со 128-битной внутренней шиной данных.
Таблица 3.5
Характеристики различных типов памяти
Тип памяти |
Частота Шины, МГц |
Разрядность шины памяти, бит |
Максимальная пропускная способность, Мб/с |
FRM DRAM EDO DRAM SDRAM Direct RDRAM SLDRAM DDR SDRAM DDR II SDRAM |
25,33 40,50 66,100,133 400,600,800 400,600,800 100,133 100,133 |
32 32 64 16 16 64 64 |
100,132 160,200 528,800,1064 1600,2400,3200 1600,2400,3200 1600,2100 3200,4200 |
Другая разновидность ИС CDRAM – микросхемы EDRAM (Enhanced DRAM) фирмы Ramtron. Микросхемы EDRAM емкостью 4 Мбит имеют 8 Кб кэш статической памяти с разрядностью внутренней шины данных 2048 бит. Память с внутренним кэшем существенно эффективнее обычной комбинации DRAM и вторичного кэша L2, особенно в многозадачных системах, где переключение задач приводит к высокой частоте кэш-промахов.
8.1. ОЗУ фирмы Rambus
В 1995 г. фирма Rumbusinc. предложила новую технологию ОЗУRambusна основе игровых ИС памятиBaseRDRAM, включающих 8-битный высокоскоростной канал обмена. Созданы 2 вида памяти Rambus – RDRAM (Direct RDRAM) и Concurent RDRAM. Вторая отличается высокой эффективностью, что делает приоритетным ее использование в графических станциях и серверах (передача данных с частотой 800 МГц). ВDirectRambusреализована шина, у которой сигналы управления передаются отдельно от данных. Естественно, потребовались модули нового типа, названныеRIMM. Они имеют 184 контакта и рассчитаны на напряжение питания 2.5 В (SDRAM-3.3B), а их емкость составляет 64/128/256 Мб. Первоначально планировалась поддержка 3RIMM, но из-за технологических проблем было принято решение о поддержке 2 модулейRIMM, что уменьшило физическую длину шины и увеличило ее надежность, однако ограничило память емкостью 512 Мб.
Технология Direct RDRAM включает структуру, состоящую из основного контроллера, интерфейса и каналов Rambus, к которым подключаются ИС, а так же генератора дифференциальных импульсов. Интерфейс Rambus реализован как в чипах RDRAM, так и в связующем их канале Rambus. Структура ОЗУ Rambus показана на рис. 3.18.Каждый каналRambusспособен поддерживать до 32 чиповDirectRDRAMи передавать данные к контроллеру памяти на частоте синхронизации шины 400 МГц автономно. К оконечной ИС канала для исключения искажения сигналов подключается согласующее устройство (терминатор).
ШД Rambus-канала 16-битная (18-ти с режимомECC), ШУ 8-разрядная, ША 8-битная. Передача адреса ячейки осуществляется последовательно по отдельным шинам для передачи адреса строки и столбца, причем адрес может передаваться параллельно с данными. Для выборки данных в ОЗУ используется конвейерный режим. Контроллер работает на частоте до 200 Мгц, что вполне достаточно как для 200 МГц системной шины К7AMD, так и для 133 МГц шиныPentiumIII600.
Рис. 3.18. Схема организации RDRAM
Согласно спецификации, емкость одного чипа RambusDRAMсоставляет 64, 128, 256 Мбит или 1 Гбит. Использование 9-го бита к байту емкостиRambusоставляет производителю материнских плат право выбора: либо для введения контроля ЕСС, либо для увеличения общей емкости ОЗУ. Таким образом, появились, соответственно, 72 и 144 Мбит варианты ИС.
Тактовая частота RDRAM– 400 МГц, но обмен данными осуществляется на переднем и заднем фронтах синхросигнала, в результате передача данных эквивалентна частоте обмена 800 МГц. Это в сочетании с двумя шинами передачи данных шириной по байту и дает нам пиковую пропускную способность чипаRDRAMв 1.6 Гб/с, в 8 раз превосходящую соответствующее значение чипаPC100SDRAM.
Для упрощения чипа ИС RDRAMнаделены лишь микрооперациями ответа на запросы, генерируемые контроллером памяти. Каждый контроллер содержитRambus– интерфейс, лицензированный практически всеми крупными производителями ИС. Контроллер ИС может располагаться при необходимости на плате модуляRIMMили в чипе чипсета.
У технологии Rambusесть недостатки, влияющие на длину задержек при выполнении циклов чтения/записи. Так, при операции записи, следующей за чтением, требуется выдержать паузу в зависимости от длины каналаRambus: для короткого канала она может составить всего один такт, 2.5 нс, тогда как в худшем случае пауза может составлять 5 тактов, что соответствует задержке равной 12.5 нс. Существуют задержки, возникающие при организации циклов микрооперациями обмена, перехода с одного режима на другой.
Для уменьшения энергопотребления питание всех чипов RDRAMуменьшено с 3.3 В, потребляемых чипамиSDRAM, до 2.5 В. Для этих же целейRDRAMимеет 4 режима работы: активный (active), надежный (standby), спящий (nap) и режим с пониженным потреблением энергии (powerdown). Каждый из них характеризуется определенным энергопотреблением и временем задержки для выполнения операции передачи данных. Обычно механизмы управления питанием переводят устройства в спящий режим тогда, когда в них нет особой нужды. Однако, чтобы не допустить перегрева, чипRDRAMже впадает в спячку во время интенсивной работы - игр, тестов, проигрывания потокового видео или аудио и т.д. Для уменьшения перегрева системы в отсутствии запросов основным режимом для всех чиповRDRAM, является режимStandby. Для включения в работу неактивного чипаRDRAMтребуется порядка 100 нc. и при переходе к активной работе пропускная способность ОЗУ может составлять только 100 Мб/с.
С каждой стороны платы модуля RIMMможет располагаться до 8 чиповRDRAMемкостью по 64 Мбита, что соответствует модулю на 128 Мб. Таких модулей на материнской плате через разъемы может подсоединяться до трех.
Архитектура двух каналов Rambusобеспечивает необходимую для МПPentium4 максимальную скорость передачи данных – 3.2 Гб/с. Однако быстродействие обмена существенно зависит от задержек при выполнении операций чтения/записи и их интенсивности.
8.2. Пакетное ОЗУ SLDRAM
В начале 1997 г. 12 производителей различных фирм объединились, чтобы создать более дешевую, чем DirectRDRAM, быстродействующую память емкостью 16, 64, 256 Мб для использования в ПК. Память нового типа с протоколом передачи данных на тактовой частоте более 400 Мгц получила названиеSLDRAM(SyncLinkDRAM). ТехнологияSLDRAMпредставляет собой следующий эволюционный шаг в развитии классического ядраDRAM.
В SLDRAMиспользуется 16-разрядная шина данных, работающая на тактовой частоте 400 МГц [4]. АналогичноDDRSDRAMиRDRAM, передача данных осуществляется на обоих фронтах тактового сигнала и пропускная способностьSLDRAMсоставляет 16 бит400 МГц2 = 1.6 Гб/с. Она может быть увеличена за счет повышения тактовой частоты и разрядности (до 64 бит) системной шины памяти.
В SLDRAMиспользована основательно переделанная архитектура синхронной памяти: адреса, команды, сигналы управления передаются в пакетном режиме по однонаправленной шине. Одновременно с ними по другой двунаправленной шинеDataLinkв пакетном режиме передаются данные. Величина всего пакета может равняться странице. Так как пропускная способность обеих шин одинакова, то переключение на любую страницу ОЗУ осуществляется без потери производительности.
Набор команд у SLDRAMувеличен, что облегчает работу контроллера. Команда представляет собой четыре 10-битных пакета и содержит всю информацию о массиве данных для проведения следующей операции в ОЗУ, что повышает производительностьSLDRAM.
8.3. Синхронное динамическое ОЗУ на 100 и 133 МГц
При переходе с тактовой частоты шины 66 МГц на 100 МГц к ОЗУ SDRAMстали предъявлять более жесткие требования. В соответствии со стандартомIntelразработала спецификацию микросхем памяти, получившую названиеPC100. Микросхемы памятиPC100SDRAMвыпускаются в тонком малогабаритном корпусеTSOP, где количество выводов ИС определяется глубиной адресного пространства микросхемы.
На основе этих микросхем изготовлены модули DIMMемкостью до 1Гб и модулиRDIMM(Registerd) емкостью 1 Гб и более с буферным ОЗУ. Варианты модуляDIMMпредставлены в табл. 3.6. Организация ШД в 72 бита используется дляDIMMс контролем ОЗУ в режимеEСС.
Таблица 3.6
Конфигурация модулей PC100SDRAM
Емкость модуля, Мб |
Организация модуля |
Емкость микросхемы SDRAM, Мбит |
Организация микросхемы SDRAM |
Количество микросхем SDRAM |
128 128 256 256 512 512 1024 |
16 Mx64 16 Mx72 32 Mx64 32 Mx72 64 Mx64 64 Mx72 128 М х 72 |
64 64 128 128 256 256 256 |
8 Mx8 8 Mx8 16 Mx8 16 Mx8 32 Mx8 32 Mx8 64 М х 4 |
16 18 16 18 16 18 36 |
С увеличением тактовой частоты системной шины до 133 МГц появились микросхемы PC133SDRAM. Задержки уPC133 на четверть меньше, чем уPC100. На подготовку к процедуре чтения или записиPC100 илиPC133 потребуется 3 такта, что дляPC100 займет 30 (310) нс, а для РС133 – 22.5 (37.5) нс. Для сравнения: величина задержки при переходе из пассивного режима в активныйPC100 иPC133 меньшеRDRAM, где она равна 57.5 (232.5) нс.
Как видно из табл. 3.5, PC133 по пиковой пропускной способности проигрывает дажеDirectRDRAM600 МГц - 1064 Мб/с против 2.4 Гб/с. Она также проигрывает по реальной и средней пропускной способности примерно 650 Мб/с против 840 Мб/с.
Если исходить из требуемой пиковой пропускной способности, то до нее не хватает и DirectRDRAM800 МГц. Если смотреть на среднюю, то она обеспечиваетсяPC100SDRAM. Из табл. 3.4. видно, чтоPC133SDRAMудовлетворяет максимальные требования как системной шины с частотой 133 Мгц, так иAGP4х.
8.4. ОЗУ с удвоенной скоростью передачи данных DDR SDRAM
Дальнейшее совершенствование SDRAM(PC66, 100, 133) способствовало разработке архитектуры ОЗУ с удвоенной скоростью передачи данныхDDRSDRAM(SDRAMII), где можно передавать по одному проводу 2 бита данных за такт [4]. В ней добавлена ассоциация каналов памяти с процессами системы. Это увеличивает пиковую пропускную способность до 1.6 Гб/с при частоте шины 100 МГц.
Этот тип памяти основан на тех же принципах, что и SDRAM, но включает в себя ряд весьма существенных возможностей. ВDDRSDRAMиспользуется синхронизация по переднему и заднему фронту, отсутствующая вSDRAM, и цикл с фиксированной задержкойDLLдля выдачи сигналаDataStrobe, означающий доступность данных на выходных контактах. Используя один сигналDataStrobeна каждые 16 выводов, контроллер может осуществлять доступ к данным более точно и синхронизировать входящие данные, поступающие из разных массивов, находящихся в одном банке.
Хотя частота кристалла остается прежней, обмен данных в DDRSDRAMосуществляется на обеих фронтах сигнала, что увеличивает вдвое пиковую пропускную способность по сравнению сSDRAM, работающей на базовой частоте. Так, если за базовую принять частоту 100 МГц, то уDDR200, пиковая пропускная способность которой 1.6 Гб/c, будет вдвое больше чем уPC100SDRAMи составитDirectRambusDRAM800 МГц.
Стандартом предусмотрена частота 133 МГц и чипы DDR266, у которых пиковая пропускная способность составляет 2.1 Гб/с.DirectRDRAMуступает ей как по пропускной способности, так и по задержкам при переходе с режима на режим (табл. 3.7.)
Модуль DIMMDDR200 потребляет примерно столько же мощности, сколько и модульPC100 той же емкости. Однако имеет 184 контакта против 164 контактовDIMMSDRAM. Это приводит к необходимости установки на материнской плате специальных разъемов.
Таблица 3.7
Характеристики DDR266 иDirectRDRAM800
Параметр |
DDR266 |
Direct RDRAM |
Пиковая пропускная способность (Гб/с) |
2.1 |
1.6 |
Эффективность работы шины памяти (%) |
65 |
85 |
Эффективная пропускная способность (Гб/с) |
1.37 |
1.36 |
В конце 2000 г. была разработана память DDRSDRAMс результирующей частотой 500 МГц, с учетом 128-битной шины пропускная способность составила 8 Гб/с.
В 2003 г. планируется производство нового поколения DDRIIс более низким напряжением питания 1.8Bвместо 2.5 В, в котором за один такт будут передаваться 4 пакета данных. Пропускная способность этой памяти на тактовой частоте 100 МГц при 64-разрядной шине составит 3.2 Гб/с.
8.5. ОЗУ с виртуальными каналами обмена
Кроме увеличения частоты обмена, существуют другие способы повысить интенсивность работы SDRAM. Один из них – использование технологии обмена с виртуальным каналомVCM, разработанной фирмойNEC. В основеVCMлежит принцип снижения длительности задержки в обмене данными за счет увеличения числа каналов обмена с разными областями ОЗУ, а также снижение энергопотребления модулей памяти. Добиться выполнения этой задачи удалось следующим образом.
В обычном ОЗУ для обмена данными по ШД любым системным устройствам (контроллеры PCI,IDEилиAGP, кэш МП) менеджер памяти делает запрос, включающий адрес, размер блока данных и т.д., как показано на рис. 3.19. Причем если все эти действия ведутся одновременно несколькими устройствами, то выполнить обмен данными по этим запросам невозможно из-за наличия только одного буфера обмена ОЗУ с системной шиной.
В VCMкаждому устройству назначается свой высокоскоростной виртуальный канал, учитывающий специфические характеристики его запросов, в том числе и обеспечивающей функции кэширования. Менеджер памяти закрепляет устройства обмена ЭВМ за конкретными каналами, которым выделяется область ОЗУ и индивидуальные или смежные банки памяти. Затем он посылает каналу команду на запись или чтение, а каждый канал, включающий все необходимые микрооперации, такие как задержки между циклами, вычисление адресов блоков и т.д., занимается индивидуальным обменом. В результате внешние и внутренние операции оказываются независимыми друг от друга и могут исполняться параллельно. Эффективность доступа к памяти значительно повышается. Причем при необходимости можно увеличить число виртуальных каналов, обслуживающих одно устройство ЭВМ. Так,AGPможет использовать каналы для загрузки текстур, расчета фигур, цвета и др.
Рис. 3.19. Структура обмена устройств ЭВМ с ОЗУ
Конструктивно, как показано на рис. 3.20, каждый виртуальный канал (ВК) включает ИС в виде буферной памяти SRAMемкостью 1 024 бит и располагается между линией ввода/вывода памяти и матрицей ячеек памяти. В буферной памяти осуществляется временное хранение данных, что позволяет с учетом разных банков осуществлять регенерацию памяти и циклы чтения/записи данных одновременно. Обмен данными между буфером виртуального канала и ячейками банка ОЗУ происходит блоками емкостью по 1 024 бита. Содержимое буфера канала затем участвует в интенсивных передачах системной шины.
По данным NEC, увеличение эффективности может достичь 90 %, а по тестамVCM133SDRAMпревосходит РС133 на 10 – 30 %. Кроме того, уменьшается энергопотребление примерно на 30 % за счет того, что в тот момент, когда происходит передача результатов приказа системному устройству, участвующему в обмене, вся фоновая активность по другую сторону виртуального канала может быть заморожена.
По выводам чипы VCMаналогичны обычным чипамSDRAM, совместимы с ними и по используемому интерфейсу.BIOSможет легко распознать модулиVCM. Модули, взаимозаменяемые с обычнымиSDRAMDIMM, причем все последние чипсеты отSiSиVIAподдерживаютVCM. Увеличение площади чипа по сравнениюSDRAMсоставляет всего 1 – 3 %, незначительно отличается и себестоимость РС133SDRAM.
VCMне критичен к типу памяти и легко может быть в дальнейшем встроен, например, вDDRSDRAM.
Рис. 3.20. Архитектура виртуального канала
В табл. 3.8 приведены модели компьютеров, использующих новые типы ОЗУ емкостью 256 Мб.
Таблица 3.8
Компьютеры с ОЗУ 256 Мб
Модель |
Центральный процессор |
Тип ОЗУ |
Видеоплата | |
Процессор |
Память (Мб) | |||
GatewayPerfomance 1500 |
Pentium 4-1500 |
RDRAM |
nVidia GeForce2 Ultra |
64 DDR SDRAM |
Dell Dimension 8100 |
Pentium 4-1500 |
RDRAM |
nVidia GeForce2 GTS | |
IBM NetVista P4 | ||||
Micron Millennia Max |
Athlon1200 |
DDR SDRAM | ||
One system |
Athlon1100 |
PC133 SDRAM | ||
Gateway Perfomance 1000 |
Pentium III-1000 | |||
HP Pavilion |
Pentium III-1000 |