7.4.3. Кэши на микросхеме процессора

Когда информация пересылается между разными микросхемами, во входных и выходных вентилях микросхем происходят значительные задержки. Следовательно, самым оптимальным решением, способным увеличить скорость функционирования кэша, является размещение его на микросхеме процессора. Однако пространство на микросхеме процессора предназначается и для многих других функций, поэтому возможный размер кэша здесь очень ограничен.

Микросхемы всех высокопроизводительных процессоров содержат хотя бы небольшой кэш. Некоторые процессоры, и в частности процессоры 68040, Pentium III, Pentium 4, имеют по два отдельных кэша, один для команд, а другой для данных. К числу тех, которые ограничиваются единым кэшем, относится процессор ARM710T.

Комбинированный кэш для команд и данных может обеспечить более высокую частоту попаданий, поскольку он гибче в отношении размещения новых данных, но зато к раздельным кэшам возможен одновременный доступ, что также ведет к повышению производительности. Недостатком раздельных кэшей является сложность управляющих схем.

Обычно высокопроизводительные процессоры имеют два уровня кэш-памяти. Кэш L1 интегрируется в микросхему процессора, а кэш L2 чаще всего бывает внешним, имеет больший объем и реализуется на основе микросхемы SRAM. Случается, что и кэш второго уровня интегрируют в микросхему процессора, как в процессоре Pentiuin III версии Coppermine, в таком случае его объем несколько меньше, чем у внешнего кэша.

Если процессор имеет два уровня кэш-памяти, доступ к кэшу первого уровня должен выполняться предельно быстро, чтобы не задерживать работу процессора. Правда, доступ к кэшу не может осуществляться так же быстро, как к регистрам, поскольку кэш намного больше и сложнее по своей структуре. Поэтому доступ к кэшу обычно ускоряют путем параллельного доступа к нескольким словам, которые затем по очереди используются процессором. Эта технология применяется во многих современных процессорах.

Кэш второго уровня может быть более медленным, но он должен иметь больший объем, чтобы обеспечить высокую частоту попаданий. Скорость его функционирования имеет сравнительно небольшое значение, поскольку она влияет только на накладные расходы, связанные с промахами кэша L1. Типичная рабочая станция может содержать кэш первого уровня объемом в несколько десятков килобайтов и кэш второго уровня объемом в несколько мегабайтов.

Наличие кэша второго уровня значительно снижает влияние скорости основной памяти на производительность компьютера. Среднее время доступа к памяти, каким оно представляется процессору в системе с двухуровневым кэшем, рассчитывается следующим образом:

t_ave = h₁C₁ + (1 – h₁)h₂C₂ + (1 – h₁)(l – h₂)M

где:

h₁ — частота попаданий в кэш L1;

h₂ — частота попаданий в кэш L2;

C₁ — время доступа к информации в кэше L1;

C₂— время доступа к информации в кэше L2;

M — время доступа к информации в основной памяти.

Количество промахов кэша L2, определяемое выражением (1 - h₁)(1 – h₂), должно быть предельно низким. Если значения h₁ и h₂ составляют порядка 90 %, то общее количество промахов, требующих обращения к основной памяти, составит менее 1 %. Таким образом, накладные расходы M с точки зрения производительности будут очень незначительны.

<<< < Предыдущая 1 2 3 4 5 6 78 / 118 9 10 11 > Следующая >>>

Соседние файлы в папке Архитектура компьютеров

#
20.03.2015395.26 Кб665.doc
#
20.03.2015329.73 Кб675_Система команд.doc
#
20.03.2015593.92 Кб696_Ассемблер-IA-32.doc
#
20.03.2015164.35 Кб506_Доп программы.doc
#
20.03.2015273.92 Кб597_Ввод-Вывод.doc
#
20.03.20151.33 Mб548_Память КОНСПЕКТ.doc
#
20.03.20151.37 Mб538_Память.doc
#
20.03.2015284.67 Кб699_Процессор-конвейер.doc
#
20.03.2015285.18 Кб539_Процессор-суперскаляр-Intel.doc
#
20.03.201523.04 Кб50TASM.doc
#
20.03.2015149.5 Кб53Практические задания.doc