Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по процессорам.doc
Скачиваний:
28
Добавлен:
02.05.2014
Размер:
243.71 Кб
Скачать

Pentium 4 в некоторых программах / тестах отстает по скорости от аналогичного по частоте / рейтингу Athlon и даже Pentium 3.

Внекоторой степени проблема в том, что у P4 очень длинный конвейер (здесь подразумевается так называемый целочисленный конвейер) выполнения инструкций. Чем длиннее конвейер, тем легче наращивать тактовую частоту, но тем меньше производительности получается на каждый полученный мегагерц. И наоборот. Чем на большее количество стадий рассчитан конвейер, тем меньше работы приходится на каждый отдельный такт и тем быстрее этот такт выполняется. Pentium 3 имеет конвейер длиной 12 стадий (можно так же сказать ступеней), Athlon (XP) - 10 стадий, Athlon 64 - 12. Pentium 4 пока является абсолютным чемпионом по длине конвейера (20 стадий), то есть имеет самое меньшее время выполнения такта, позволяющее достичь максимальной тактовой частоты, но и самые большие задержки для связанных друг с другом операций. Более важным становится предсказание того, выполнение какой инструкции понадобится, задолго до самого процесса ее выполнения. И, естественно, ошибка на этой стадии - выбор не той ветви, по которой пойдет процесс выполнения программы, будет весьма и весьма сказываться на производительности процессора. Конвеер в случае ошибки предсказания ветвления "сбрасывается на нуль" и выполнение идёт заново, т. е. в идеале из-за каждой ошибки предсказания "теряется" до 20 драгоценных тактов. Думаю, что несложно подсчитать, чем это чревато при среднем количестве ошибок предсказания (5%) в случае с 2ГГц процессором. В целочисленных операция P4 работает хорошо, а вот в операциях с плавающей точкой у него ситуация похуже, там он значительно проигрывает AXP. Еще недавно было мало приложений поддерживающих набор инструкций SSE2, использованный в P4 и способный значительно увеличить скорость его работы (скорость работы FPU, хотя, условно говоря, SSE2 не помогает FPU, а фактически его заменяет). На самом деле все немного сложнее, но не имеет особого смысла вникать во все эти тонкости...

При обработке больших объемов данных, где львиную долю всего процесса занимает переписывание информации из одного места памяти в другое, P4 лидирует. В играх же, начать следующие вычисления, как правило, не удается, не закончив предыдущие (процессор частично простаивает, пока предыдущая инструкция не выйдет с конвейера). И вот тут голову поднимает AXP. Масла в огонь подливают и различные наборы инструкций: 3DNow!, 3DNow!Professional, SSE, SSE2, - где скорость работы зависит от того, под какой процессор оптимизировано приложение. Первые модели P4 на ядре Willamete действительно ощутимо проигрывали даже близким по частоте моделям Pentium 3, не говоря уж об Athlon'ах. Но у Northwood’ов это отставание почти никогда не проявляется.

Насколько хороши процессоры via c3?

Единственным их достоинством являются низкое тепловыделение. Рассеиваемая мощность у них 5-20 Ватт против 40-60 (в среднем) у AXP и P4. C3 совместимы с устаревшим (по мнению Intel) Socket 370, хотя не со всеми платами, например для нового ядра Nehemiah требуется поддержка Tualatin'а со стороны платы. По скорости они очень сильно уступают (до 50%, иногда даже больше) аналогичным по частоте процессорам Intel и AMD. Даже некоторые усовершенствования вроде поддержки SSE им ничего особо не дали. В продаже данных процессоров почти нет и я ничуть об этом не сожалею :). В случае если вам нужна тихая машина (такому процессору часто достаточно только радиатора), а скорость не важна, то можно взять. Теоретически они должны бы разгоняться неплохо (технология изготовления достаточно прогрессивная), но на практике этого не наблюдается - сказывается малый "запас прочности" и неэффективная проектировка ядра.