Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 665

.pdf
Скачиваний:
17
Добавлен:
30.04.2022
Размер:
3.51 Mб
Скачать

по всем столбцам сразу. Следовательно, при открытии строки считывается вся страница памяти целиком, а для чтения значения конкретной ячейки памяти необходимо просто считать значения усилителя нужной линии данных (линии столбца).

Адресные линии мультиплексированы, что позволяет вдвое уменьшить их количество, но и время увеличивается вдвое, поскольку адреса столбца и строки передаются последовательно. Два специальных управляющих сигнала синхронизируют обращение к ячейке (рис. 16):

RAS# —сигнал выбора строки (Row Access Strobe); CAS# — сигнал выбора столбца (Column Access Strobe).

tCL

Время доступа

Рис. 16. Временная диаграмма доступа к данным

Первоначально на адресные линии подается адрес строки и сигнал RAS#, по которому на нужную строку матрицы памяти подается напряжение, и все транзисторы, соединенные с данной строкой, переходят в открытое состояние, а содержимое всей строки помещается в усилитель уровня. Такая операция называется активацией строки и определяется вре-

менем tRCD (рис. 16).

40

Далее передается адрес столбца и одновременно сигнал CAS#. После этого усилитель уровня ячейки DRAM передает данные, соответствующие адресу столбца в буфер вывода (активация столбца за время tCL).

При установке CAS в низкий уровень после прихода положительного фронта тактирующего импульса CLK, происходит выборка адреса столбца, который присутствует в данный момент на шине адреса, и открывается доступ к нужному столбцу матрицы памяти, то есть формирование данных на линии DQ.

Поскольку активация строки является деструктивной операцией, то после считывания данных строки их необходимо восстановить в строке. Эта операция называется перезарядкой или регенерацией строки (PRECHARGE). Поэтому на заключительном этапе сигналы RAS# и CAS# устанавливаются в высокое состояние (RAS to Precharge), а микросхема памяти производит восстановление содержимого строки.

Задержки между подачей управляющих сигналов измеряются в тактах системной шины и называются тай-

мингами. Существует множество различных способов задания тайминга. Основные тайминги памяти принято записывать в виде последовательности четырех чисел:

tCL-tRCD-tRP-tRAS, (4.1)

где tCL (CAS Latency) – временная задержка в тактах, которая происходит с момента подачи сигнала CAS до выдачи первого элемента данных на шину (каждый последующий элемент данных появляется на шине данных в очередном такте);

tRCD (RAS to CAS Delay) –задержка подачи сигнала CAS относительно сигнала RAS;

tRP – время, необходимое для регенерации и завершения цикла обращения к памяти, отсчитывается от команды PRECHARGE и до поступления новой команды активации

41

уже другой или той же самой строки памяти (в том же логическом банке);

tRAS (Active to Precharge Delay) —минимальный проме-

жуток времени, который должен пройти с момента подачи команды активации строки (RAS) до команды PRECHARGE, т. е. время, в течение которого строка остается активирована.

Пропускная способность SDRAM определяется как

R=f*N*k,

(4.2)

где f – частота системной шины;

N – количество байт, передаваемых за один такт (ширина шины процессор-памяти);

K – коэффициент увеличения пропускной способности. Следует иметь в виду, что речь идет о максимально возможной пропускной способности, которая реализуется только в случае последовательной передачи данных, когда данные передаются с каждым тактом (пакетная передача). Смысл пакетной обработки заключается в том, что при активированной строке задание адреса столбца позволяет обратиться к последовательности нескольких столбцов (пакету) без дополнительного указания их адресов. Для этого в микросхеме SDRAM предусмотрен счетчик адресов. Количество адресуемых столбцов определяется длиной пакета (Burst Length, BL),

диаграмма доступа представлена на рис. 17.

Радикальным способом увеличения пропускной способности памяти стал переход к стандарту DDR (Double Data Rate

– удвоенная скорость передачи данных). Повышение быстродействия в DDR обеспечено за счет увеличения тактовой частоты и числа буферов промежуточного хранения (I/O Logic), через которые матрица элементарных ячеек памяти (ядро) обменивается данными с шиной памяти [12].

В DDR-памяти каждый буфер ввода-вывода передает два бита за один такт, то есть фактически работает на удвоенной тактовой частоте, оставаясь при этом полностью синхронизированным с ядром памяти. Однако для того чтобы реали-

42

зовать такой режим работы, необходимо, чтобы эти два бита были доступны буферу ввода-вывода на каждом такте работы памяти. Для этого требуется, чтобы каждая команда чтения приводила к передаче из ядра памяти в буфер сразу двух бит (рис. 18). С этой целью используются две независимые раздельные линии передачи от ядра памяти к буферам вводавывода по положительному фронту тактирующего импульса.

Рис. 17. Временная диаграмма доступа к данным при пакетной передаче

Рис. 18. Схема способа организации памяти – двойная предвыборка (Pre-fetch 2n)

43

Из буфера ввода-вывода один бит поступает на шину данных по положительному, другой по отрицательному фронту тактирующего импульса в нужном порядке. Это обеспечивает в два раза более высокую скорость работы буфера и соответственно вдвое большую пропускную способность памяти. В общем случае может быть организована 2n бит предвыборка перед передачей на шину данных – 2 независимые линии по n-бит каждая –архитектура памяти 2n-prefetch – DDRn. В этой архитектуре доступ к данным осуществляется «попарно», т.е. каждая команда чтения приводит к передаче двух элементов данных (BL>2).

Временная диаграмма работы памяти DDR3 SDRAM представлена на рис. 19. Сравнение RAM-ЗУ, представленное в табл. 7, показывает, как архитектура 2n-prefetch влияет на быстродействие.

Рис. 19. Временная диаграмма работы памяти DDR3 SDRAM (без учета банков памяти)

44

 

 

 

 

 

Таблица 7

 

Параметры модулей динамической памяти

Тип

 

Частота

Частота

Пред-

Пропускная

 

 

ядра,

шины,

выборка

способность,

 

 

МГц

МГц

 

ГБ/с

SDRAM

 

100-166

100-166

1n

0,8-1,3

DDR

 

133-200

133-200

2n

2,1-3,2

DDR2

 

133-200

266-400

4n

4,2-6,4

DDR3

 

133-200

533-800

8n

8,5-14,9

DDR4

 

133-200

1066-1600

8n

17,0-21,3

Длительность цикла обращения (access cycle) оценивает последовательный (пакетный) доступ к данным и вычисляется как

T=tD+N/R,

(4.3)

где tD – время доступа к ячейке памяти, вычисляемое как tCL+tRCD+tRP;

N – передаваемая порция (длина пакета); R – скорость передачи данных.

4.2. Задания и рекомендации по их выполнению Задание 1. Опишите полупроводниковые ЗУ с произ-

вольным доступом в анализируемом ПК по плану:

Емкость, ГБ

значение

Ширина выборки1, Б

значение

Тайминг

значение по ф. (4.1)

Физический тип ЗУ

DDR* SDRAM

Частота шины памяти, МГц

Значение DRAM frequency,

 

соответствующее запи-

 

санному таймингу

*) указать конкретное значение

 

1 Порция данных, извлекаемых за одно обращение, обычно соответствует длине машинного слова (ширина шины памяти)

45

Тайминг – это временные задержки сигналов, определяющие взаимное расположение сигналов на шине памяти. Их и частоту памяти можно получить из программы CPU-Z (рис. 20). В AIDA64 эта информация указана на вкладке Чипсет (если контроллер памяти в чипсете), примерное рабочее окно на рис. 21.

Поскольку мера таймингов (Т) – это такт шины памяти или контроллера памяти чипсета или процессора. В примере на рис. 20 – DRAM Frequency=799.9 МГц, тогда время доступа составляет 27/799.9*106=33,7

В обозначении памяти может указываться эффективная частота памяти, например, как рис. 21 – DDR3-1066, где 1066 МГц – тактовая частота шины памяти. И при ширине шины данных 8 байт пропускная способность составит 8,53 Гбайт/с.

Рис. 20. Описание оперативной памяти в программе CPU-Z

46

Рис. 21. Описание оперативной памяти в программе AIDA64

Задание 2. Сравнение теоретической и измеренной задержки памяти.

Указания к выполнению

1. Для вычисления теоретического времени доступа следует по реальным значениям tRCD, CL и tRP, полученным в задании 1 для длины пакета BL=2n, построить временную диаграмму работы памяти.

47

Время доступа вычислить как число тактов от момента как выставлен адрес (подан RAS), и до момента, когда данные будут доступны (данные на DQ), умноженное на время такта шины памяти (DRAM frequency).

2.Измеренное значение было получено в предшествующей работе при выполнении теста латентности. Также можно воспользоваться тестами AIDA Cache&Memory Benchmark (рис. 22) – значение Latency.

3.Результаты экспериментальной и теоретической оценок сравните как отношение их разницы к теоретическому значению (эталон). Поясните полученные различия. Учтите при расчете теоретического времени доступа – время на регенерацию строки и дезактивацию.

4.Сделайте выводы. Обратите внимание, что иногда формула таймингов для памяти может состоять из четырёх цифр, например 2-2-2-6. Последний параметр называется «DRAM Cycle Time» и характеризует быстродействие всей микросхемы памяти, т. е. время доступа к порции данных, а не одной единице.

Задание 3. Оцените различия теоретической, рассчитанной по параметрам микросхем, и измеренной с помощью бенчмарков пропускной способности.

Указания к выполнению

1. Скорость передачи данных или пропускная способность оперативных ЗУ вычисляется как произведение объема данных, передаваемых за каждый такт на частоту системной шины. Например, оперативная память имеет ширину шины (ширина выборки из ЗУ) 8 байт, а тактовая частота шины составляет 333 МГц, тогда пропускная способность составит 8*8*333*106 бит/с. Более современные схемы оперативной памяти имеют двух-, трех- и более каналов для подключения, соответственно их пропускная способность удваивается, утраивается.

48

Обратите внимание, при определении пропускной способности используется единица измерения в бит/c (бит в секунду) или Б/c (байт в секунду). Для объема памяти 1 КБ = 1024 байт, 1 МБ = 1024 КБ = 1 048 576 байт и т. д. Для скоростей в битах используются те же приставки, но 10 Гбит/с подразумевает 1010 бит за секунду.

2. Для измерения реального значения воспользуйтесь тестами AIDA Cache&Memory Benchmark (рис. 22) – значение Latency

Рис. 22. Результаты тестов AIDA Cache&Memory

3.Результаты теста AIDA Cache&Memory Benchmark

пересчитайте в те же единицы измерения, что и для теоретической пропускной способности.

4.Различия рассчитайте как отношение экспериментально полученного значения к расчетному теоретическому в %. Оцените различия. Сделайте выводы.

4.3.Виды и материалы контроля выполнения работы

По результатам выполнения работы должен быть подго-

товлен отчет, содержащий:

полную информацию о характеристиках всех модулей ОЗУ, установленных в ПК;

временные диаграммы работы памяти; результаты сравнения параметров быстродействия, по-

лученных расчетным путем и измеренных.

Контрольно-тестовые задания

1. Быстродействие ОЗУ характеризуется: а) временем доступа;

49