2) Сократить время вычислений.

3) Делать как можно меньше операций в течении одного цикла (конвейер команд).

4) Оптимизация работы с памятью (кэш-память)

6.1.5.1…Чтобы шли быстрее

Заставить поток битов ходить в процессоре быстрее непросто. Во-первых, нужно, насколько это возможно, уменьшить число препятствий на пути электронов. Это зависит от технологии производства, и температуры кристалла. Чем лучше технология, тем лучше конечный продукт.

А температура? Она то тут причем? А притом, что атомы в кристаллической решетке находятся в тепловом движении, и амплитуда его пропорциональна температуре. А чем больше амплитуда, тем меньше шансов у электрона проскочить мимо атома. Таким образом, чем ниже температура, тем более беспрепятственно движутся электроны. Именно поэтому охлажденные процессоры работают быстрее.

Еще один способ уменьшить время прохождения битов заключается в сокращении проходимого ими пути. Для этого следует уменьшить размеры транзисторов, а как следствие, расстояние между ними.

6.1.5.2…Сократить время вычислений

Машины хорошо умеют делать параллельно несколько вещей. Поэтому какой-нибудь навороченный блок для сложения сможет складывать быстрее, чем более простая конструкция, сокращая, таким образом, DALU. Впрочем, здесь не все так просто: сложное устройство, конечно, считает быстро, но зато оно и больше.

6.1.5.3Конвейер команд

Как известно, сущность работы процессора заключается в выполнении программы, хранящейся в памяти. Программа представляет собой набор команд (инструкций) и данных. Считывая эти команды, процессор выполняет определенные действия. Проблема в том, что процесс обработки команды не может быть выполнен за одну стадию.

В «ранних» процессорах обработка следующей команды не могла быть начата до завершения всех этапов обработки над предыдущей. Это существенно тормозило работу процессора – на каждую инструкцию уходило более 10 тактов процессорного ядра. Инженеры не могли с этим мириться, поэтому обработку команд они поставили, в буквальном смысле, на конвейер – как только команда проходила один из этапов, сразу же на ее место становилась следующая, чтобы пройти аналогичный этап, и т.д.

Первые конвейеры, обладателями которых стали 486-е компьютеры, были пятиступенчатыми (рис. 6.3.).

Рис. 6.3. Конвейер из 5 стадий

В современных процессорах этапы стандартного пятиступенчатого конвейера делят еще на более мелкие части (например, у Pentium II конвейер имеет 10 ступеней, у Pentium 4 – 20). С увеличением числа ступеней в конвейере на каждый шаг приходится меньше работы, а, следовательно, и меньше аппаратной логики. Упрощение логики, в свою очередь, позволяет повысить рабочую частоту процессора. Именно этот факт позволил Pentium 4 достичь таких высоких рабочих частот. Наличие более 5 ступеней в конвейере носит название «суперконвейеризация».

Так что же мешает увеличивать число стадий неограниченно?

Сделать то можно, но дело в том, что это может вызвать некоторое подобие пробки в процессоре. Разберемся в этом поподробнее.

Представим себе, что инструкция 1 требует вычисления А=С*2, а инструкция 2 – В=А+1. Если на вычисление А уходит 20 тактов, то за выполнение инструкции 2 процессор возьмется лишь через 29 тактов! Ясно что, чем больше стадий у конвейера, тем большая «пробка» может образоваться.

Начиная с 5-го поколения, в процессорах появился двои ной конвейер – U (основной) и V (дополнительный). Основной конвейер выполняет все команды, а дополнительный – ряд наиболее распространенных инструкций (рис. 6.4).

Рис. 6.4. Двойной конвейер

При этом становится возможным выполнять, в среднем, более одной команды за такт. Процессор, имеющий в своем составе два и более конвейера, называется суперскалярным. Переход к четырем конвейерам возможен, но это потребовало бы создания громоздкого аппаратного обеспечения, поэтому используется другой подход. Основная идея – один конвейер с большим количеством функциональных блоков (рис. 6.5). Стадия 3 выпускает команды значительно быстрее, чем стадия 4 способна их выполнять. Поэтому процессор вызывает команду из памяти и помещает в один функциональных блоков стадии 4 для параллельного выполнения.

Рис. 6.5. Суперскалярный процессор с пятью функциональными блоками

Введение нескольких конвейеров значительно повышает производительность процессора без увеличения частоты.

<<< < Предыдущая 18 19 20 21 22 23 24 25 26 27 28 2930 / 5530 31 32 33 34 35 36 37 38 39 40 41 42 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.09.2019154.4 Кб64Лекции по информационному праву.docx
#
01.05.2025680.45 Кб0Лекции по истории социальной работы.doc
#
11.02.2015974.34 Кб32Лекции по логике.doc
#
11.02.2015665.54 Кб181Лекции по ММПР для БА 4 (ОЗО).docx
#
01.04.202538.19 Кб2Лекции по спецухе.docx
#
22.04.20198.11 Mб29Лекции по ФЭВМ (основная часть).doc
#
13.08.201963.49 Кб33лекция № 6 Семейство кишечных инфекций.doc
#
01.05.2025257.94 Кб1лекция 4,5 Археология.docx
#
01.05.2025149.5 Кб1Лекция 6.(СД).doc
#
11.02.20151.15 Mб233Лекция антропогенез.doc
#
11.02.201543.01 Кб69Лекция по проблеме борьбы со СПИДом.doc