- •1. Устройство процессора
- •2. Архитектура процессоров Pentium 4
- •2. Архитектура процессоров Pentium 4
- •3. Архитектура amd k7(Athlon)
- •4. Архитектура многоядерных процессоров
- •5. Процессоры ibm power
- •6. Семейство процессоров via
- •7. Семейство процессоров Transmeta
- •8. Форм-факторы системных плат
- •9. Схемотехника системной платы
- •10. Системная память
- •10.1 Динамическая и статическая память
- •10.2 Статическая память
- •10.3 Динамическая асинхронная память dram
- •10.4 Динамическая синхронная память sdram
- •10.5 Память ddr sdram
- •10.6 Память ddr2 sdram
- •10.7 Память ddr3 sdram
- •10.8 Память fb-dimm
- •10.9 Память dr dram
- •10.10 Микросхемы памяти
- •10.11 Модули памяти
- •10.12 Маркировка
- •11. Корпус
- •1. Внутренние интерфейсы
- •1.1 Системная шина gtl
- •1.2 Шина HyperTransport
- •1.3 Шина чипсета
- •1.4 Шина isa/eisa
- •1.5 Шина pci
- •1.6 Шина agp
- •1.7 Шина pci Express
- •1.8 Шина ata (ide)
- •1.9 Шина Serial ata
- •1.10 Шина scsi
- •1.11 Интерфейс acpi
- •2. Внешние интерфейсы
- •2.1 Шина сом
- •2.2 Интерфейс IrDa
- •2.3 Шина lpt
- •2.4 Шина usb
- •2.5 Шина FireWire
- •2.6 Порт Bluetooth
- •1. Графические ускорители
- •2 Устройство видеоадаптера
- •3. Технология sli
- •4. Программные интерфейсы
- •5.1 Вершинные шейдеры
- •5.2 Пиксельные шейдеры
- •6. Графический процессор
- •6.1 Первое поколение графических процессоров (1995-1997)
- •6.2 Второе поколение (1997-1999)
- •6.3 Поколение DirectX 7 (1999-2002)
- •6.4 Поколение DirectX 8
- •6.5 Поколение DirectX 9
- •6.6 Поколение DirectX 10
- •7. Телевизионные тюнеры
- •7.1 Устройство тв-тюнера
- •8. Устройство видеозахвата
- •9. Мониторы
- •9.1 Мониторы на элт(crt)
- •9.2 Параметры мониторов элт
- •9.3 Жк дисплеи
- •9.4 Технологии производства активных матриц
- •9.5 Параметры жк-дисплеев
- •11. Мультимедийные проекторы
- •1. Аудиосистема
- •2. Цифровая обработка звука
- •3. Пространственное звучание
- •4. Устройство звуковой карты.
- •5. Аппаратные средства обработки звука
- •5.1 Кодеки ас'97
- •5.2 Кодеки High Definition Audio
- •5.2 Кодеки High Definition Audio
- •5.3 Кодеки Realtek
- •5.4 Кодеки via
- •5.5 Кодеки nVidia
- •5.6 Кодеки c-Media
- •5.7 Кодеки Analog Devices
- •6. Интерфейс midi
2. Архитектура процессоров Pentium 4
Архитектура ПК
С выходом Pentium 4 на свет появился процессор седьмого поколения (Pentium Pro, Pentium II/III относятся к шестому поколению — Р6). Необходимо перечислить новшества архитектуры Willamette, позволяющие отнести процессор Pentium 4 к новому поколению: • асимметричное ядро с блоками, работающими на различных скоростях; • значительно улучшенная версия суперскалярного механизма исполнения инструкций; • новый кэш второго уровня, отслеживающий порядок выполненияинструкций; • переработанные блоки операций с мультимедийными данными и числами с плавающей запятой; • огромный набор новых инструкций; • новая системная шина, передающая по 4 пакета данных за такт (архитектура Quad Pumped); • конвейер выполнения инструкций из 20 стадий. Cтартовую рабочую частоту процессора в 1,5 ГГц удалось добиться за счет новой архитектуры конвейера выполнения инструкций. Pentium III имеет конвейер длиной 12 стадий (17 стадий FPU), Athlon — 10 стадий (15 стадий FPU). Pentium 4 при длине конвейера 20 стадий позволяет достичь максимальной тактовой частоты, но и получает самые большие задержки для связанных друг с другом операций (второй операции придется ожидать 20 тактов, пока не завершится первая операция).
Производительность любого процессора можно определить как произведение рабочей частоты ядра на число операций за такт. Очевидно, что чем больше каждый из множителей, тем больше произведение. Чисто теоретически наращивать производительность можно как за счет роста частоты, так и количества исполняемых за такт команд. Однако на практике эти два параметра связаны сложной обратно пропорциональной зависимостью. Увеличение числа исполняемых за такт команд требует специального дизайна ядра, сложного анализа взаимозависимостей команд, что ведет к резкому повышению числа логических элементов в ядре. Серьезным препятствием служит сам код программ, ограничивающий распараллеливание используемых алгоритмов. Для повышения рабочей частоты ядра требуется оптимизировать дизайн таким образом, чтобы на каждой стадии работы процессора выполнялось примерно одинаковое количество операций. Рост частот всегда ведет к повышению тепловыделения. Поэтому архитектура процессора, реализованная согласно текущим технологическим нормам, имеет верхний предел рабочих частот. Например, для процессора Pentium 4 на ядре Northwood (технорма 130 нм) верхним пределом стала частота 3,4 ГГц. Дальнейший «разгон» стал возможен с переходом на более жесткие технологические нормы 90 нм в ядре Prescott. Но этот источник увеличения производительности не бесконечен. Например, ядро Prescott позволило поднять частоту всего до 3,8 ГГц. Вообще при развитии архитектуры процессоров х86 корпорация Intel стремилась увеличить как количество команд, исполняемых за такт, так и рабочую частоту ядра. Каждое новое поколение процессоров (80286, 80386, 80486, Pentium, Pentium Pro) могло исполнять больше команд за такт, чем предыдущее. При этом с улучшением технологического процесса обычно росла и частота процессоров. Другими словами, постепенно увеличивались оба множителя, что приводило к быстрому росту производительности. Так продолжалось до тех пор, пока частотный потенциал микроархитектуры Р6 не был практически исчерпан, то есть до частоты 1400 МГц. Вершиной развития этой микроархитектуры стал процессор Pentium III-S. Хотя его уровень производительности был весьма достойным, по многим параметрам он уступал процессорам Athlon компании AMD. На смену Р6 пришла архитектура NetBurst процессора Pentium 4, ознаменовавшая изменение приоритетов в разработке ядра. Усилия были сосредоточены на том, чтобы при одинаковом с Р6 технологическом процессе получить более высокие рабочие частоты. С маркетинговой точки зрения это был правильный выбор. Пользователи, убежденные в том, что «больше» означает «лучше», проголосовали кошельком за новые приоритеты. Началась гонка за мега- и гигагерцы, в которой Pentium 4 однозначно положил на обе лопатки сначала Athlon, а затем Athlon ХР.
На блок-схеме ядра Willamette представлены основные функциональные блоки процессора. (1) Исполнительный участок (Back End) с исполнительными устройствами и обслуживающими их элементами. (2) Подготовительный участок (Front End) с устройствами, отвечающими за декодирование инструкций и своевременную их подачу на исполнительный участок. Сюда же входит группа устройств, обеспечивающих некоторые специфические возможности: блок предварительной выборки (Prefetch), блок предсказания переходов (Branch Prediction Unit). (3) Подсистема памяти (Memory Subsystem), управляющая загрузкой и подачей данных на участки . Технология Hyper-Threading В модификации Pentium 4 на ядре Nortwood В впервые реализована технология виртуальной двухпроцессорности Hyper-Threading. Строго говоря, все необходимые аппаратные блоки присутствовали еще в процессоре Pentium 4 с ядром Willamette, однако они были отключены (видимо, по маркетинговым соображениям). И только с появлением Pentium 4 с частотой 3,06 ГГц мультипроцессорные технологии стали доступны обычному пользователю. Не секрет, что стоимость двухпроцессорных машин, позиционируемых как рабочие станции или серверы, ограничивала их применение в домашних условиях. Теперь пользователь получает два логических (виртуальных) процессора на одном физическом ядре и может использовать их на обычной системной плате. Следует подчеркнуть, что основная часть ресурсов ядра (в частности процессорный конвейер и кэш-память) используются логическими процессорами совместно, поэтому о революционном повышении производительности речи не идет. Однако немалая часть ресурсов ядра простаивает во время работы других элементов, а технология Hyper-Threading позволяет загрузить временно простаивающие блоки другими задачами. Учитывая, что многозадачность является одним из краеугольных камней современных операционных систем и приложений, технология Hyper- Threading дает заметный рост производительности системы. Эффективность блоков Hyper-Threading при выполнении конкретных приложений сильно зависит от степени оптимизации кода программы. Чем лучше оптимизирован код для архитектуры Pentium 4, тем меньше будет выигрыш от применения Hyper-Threading, поскольку «правильный» код нагружает элементы процессора по максимуму. Если же оптимизация кода далека от идеала, происходят промахи размещения данных в кэш-памяти, ошибки предсказания ветвлений, нарушение параллелизма выполнения инструкций. В результате часть аппаратных блоков ядра простаивает, ожидая результатов критичных операций. В этот момент свободные блоки могут быть представлены операционной системе как элементы второго, логического процессора и получить собственные задачи, выполнение которых будет происходить независимо от работы других элементов.
