
В любом случае ясно, что проблемам надежности компьютеров на базе К7, по крайней мере на настоящий момент, следует уделить особое внимание. Наиболее важно это при применении таких ПК-серверов в качестве узлов кластера Beowulf, где при выполнении длительных расчетов надежность отдельных узлов является критической. В конференции Usenet сomp.arch можно познакомиться с неким «паническим» письмом, автор которого утверждает, что К7, как и К6, имеет массу ошибок при работе с плавающей запятой. Поскольку микропроцессоры архитектуры x86 от Intel также имели подобные ошибки, хотя и немного (отметим, что такие неприятности случались и с известными RISC-процессорами), возможность подобных ошибок в К7 нельзя исключать, хотя свидетельствами этого автор не располагает.
С учетом вышесказанного в суперкомпьютерном центре Института органической химии РАН специально занялись тестированием компьютеров на базе К7 с материнской платой от Gigabyte (именно на этой плате были достигнуты наивысшие для К7 показатели SPECint95). Эти работы поддерживаются РФФИ (проект 98-07-90290) и Московским комитетом по науке и технологиям (проект Б-195).
Оценки производительности
В табл. 3 приведены данные о производительности К7 на разных тактовых частотах на тестах SPEC95. Эти данные свидетельствуют о преимуществе К7 перед Pentium III при равных тактовых частотах, особенно по производительности с плавающей запятой (что, с учетом сказанного выше, достаточно естественно). Однако ситуация становится иной, если проводить сопоставление с Pentium III Coppermine, в котором кэш второго уровня интегрирован в микропроцессор и работает на его тактовой частоте. Эти процессоры обгоняют К7 на тестах SPEC95 при равных частотах. На тестах SPEC95 K7/1ГГц уступает по производительности Coppermine c той же частотой. Вероятно, это определяется низкой частотой шины кэша второго уровня. Имеются данные, что Coppermine обгоняют К7 и на трехмерных играх.
Путь, связанный с интеграцией кэша второго уровня в микропроцессор, уже показал свою эффективность. Так, это позволило HP PA-8500 приблизиться к Alpha 21264 по производительности. Однако следует учесть, что небольшая емкость кэша второго уровня в Сoppermine (вдвое меньше, чем в К7) может привести к падению производительности на задачах, плохо локализуемых в кэше, к числу которых относятся многие задачи «экономического» характера. Поэтому производительность К7 должна быть более стабильной для широкого класса приложений.
Следует также учесть, что, как видно из табл. 3, наиболее высокие результаты для Pentium III Coppermine достигнуты благодаря применению дорогой быстродействующей памяти RDRAM. некоторые модели Сoppermine также может работать с памятью на 133 МГц (PC133). В «равных условиях» (то есть при одинаковой частоте процессора, кэша второго уровня и одинаковом типе оперативной памяти) К7, по мнению автора, должен быть быстрее.
Кроме того, отсутствие на сегодня компиляторов, учитывающих при оптимизации особенности строения К7, означает, что у процессора имеются еще некоторые резервы повышения производительности. Наконец, AMD недавно продемонстрировала и симметричный ответ – К7 с частотой 1,1 ГГц, где кэш второго уровня также интегрирован в процессор. К концу года емкость этого кэша должна быть увеличена до 1 – 2 Мбайт (процессор «Mustang»). На Web-сервере AMD можно найти сравнительные данные о производительности K7 и на тестах, отвечающих массовым приложениям для ПК; эти данные коррелируют со SPEC95.
Наконец, упомянем и о тестах STREAMS, характеризующих пропускную способность оперативной памяти. По этим характеристикам процессоры К7 заметно опережают Pentium III. При использовании набора микросхем КХ133 пропускная способность на этих тестах еще более возрастает. Однако при использовании Сoppermine с памятью типа RDRAM ситуация, возможно, изменится.

В качестве тестов производительности на реальных приложениях могу сослаться на данные в области задач вычислительной химии. В ряде случаев, например, когда удается использовать оптимизированные для К7 библиотечные подпрограммы BLAS, ускорение по сравнению с Pentium III c той же тактовой частотой оказывается значительным. В качестве примеров программ, где достигается существенное ускорение, можно привести DMOL и Jaguar.
Борьба за лидерство в области производительности x86-cовместимых микропроцессоров обострилась до предела. Существенно также и соотношение стоимость/производительность. Хотя подобный анализ лежит вне рамок настоящей публикации, укажем стоимость процессоров (в партиях 1 тыс. штук): она составляет 1299 долл./999 долл./899 долл. для моделей AMD K7 с частотой 1 ГГц/950 МГц/900 МГц соответственно. Pentium III/1 ГГц Coppermine стоит дешевле конкурента — 990 долл., но его массовые поставки пока не начались.
С моей точки зрения, основное, на что следует обратить внимание при приобретении компьютера на базе процессора AMD К7, если речь идет о серьезных и сложных задачах, это вопросы надежности.
Об авторе
Михаил Кузьминский – старший научный сотрудник суперкомпьютерного центра Института органической химии РАН. С ним можно связаться по телефону (095)1356388.
Литература
[1]Михаил Кузьминский, Сomputerworld Россия, № 20’97, № 47’98.
[2]Михаил Кузьминский, Открытые системы, 1998, № 1, стр. 7.
Таблица 1. Некоторые характеристики x86-МП
AMD и Intel
|
|
AMD |
|
AMD |
|
Intel |
|
|
|
|
Pentium |
||
|
|
K7 |
|
K6-3 |
|
|
|
|
|
|
III |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Тип разъема |
|
Slot |
|
Socket |
|
Slot 1 |
|
|
A |
|
7 |
|
|
|
|
|
|
|||
Число контактов |
|
242 |
|
321 |
|
242 |
|
|
|
|
|
|
|
Число транзисторов, |
|
22 |
|
9,5 |
|
21 |
млн. штук |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||
Емкость кэша первого |
|
128 |
|
64 |
|
32 |
уровня, Кбайт |
|
|
|
|
|
|
|
|
|
|
|||
Емкость кэша второго |
|
0,5-8 |
|
0,256 |
|
0,5-2 |
уровня, Мбайт |
|
|
|
|
|
|
|
|
|
|
|||
Тактовая частота шины, |
|
200- |
|
100 |
|
100* |
МГц |
|
400 |
|
|
|
|
|
|
|
|
|
|
|
Пропускная |
|
1,6- |
|
|
|
|
способность шины, |
|
|
0,8 |
|
0,8* |
|
|
3,2 |
|
|
|||
Гбайт/с |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Число целочисленных |
|
|
|
|
|
|
исполнительных |
|
3 |
|
2 |
|
2 |
устройств |
|
|
|
|
|
|
|
|
|
|
|
|
|
Число исполнительных |
|
|
|
|
|
|
устройств с плавающей |
|
3 |
|
1 |
|
1 |
запятой |
|
|
|
|
|
|

* Для Pentium III/Coppermine при частоте шины 133
МГц пропускная способность равна 1,06 Гбайт/с
Таблица 2. Времена выполнения некоторых команд с плавающей запятой
(задержка/пропускная способность, в тактах, 1 соответствует полностью конвейеризованной операции)
|
|
|
|
|
|
Команда |
|
AMD K7 |
|
Intel Pentium III |
|
|
|
|
|
||
FADD |
|
4/1 |
|
3/1 |
|
|
|
|
|
||
FMUL |
|
4/1 |
|
5/2 |
|
|
|
|
|
||
FDIV (SP) |
|
16/13 |
|
17/17 |
|
|
|
|
|
||
FDIV (DP) |
|
20/17 |
|
32/32 |
|
|
|
|
|
||
FSQRT (SP) |
|
19/16 |
|
28/28 |
|
|
|
|
|
||
FSQRT (DP) |
|
27/24 |
|
57/57 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Журнал "Открытые системы", #01-02, 2000 год // Издательство "Открытые системы" (www.osp.ru)
Постоянный адрес статьи: http://www.osp.ru/os/2000/01-02/008.htm