Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕМА2 - КСиС.DOC
Скачиваний:
16
Добавлен:
15.11.2019
Размер:
224.77 Кб
Скачать

Лекция № 2.3. Классификация процессоров (cisc и risc).

Процессоры различают двумя основными архитектурами набора команд: архитектуры CISC и RISC.

Лидером в разработке микропроцессоров с полным набором команд (CISC – Complete Instruction Set Computer) считается компания Intel со своей серией х86 и Pentium. Эта архитектура является практическим стандартом для рынка микрокомпьютеров. Для CISC-процессоров характерно: сравнительно небольшое число регистров общего назначения; большое количество машинных команд.

Основой архитектуры современных рабочих станций и серверов является архитектура компьютера с сокращенным набором команд (RISC – Reduced Instruction Set Computer).

Среди других особенностей RISC-архитектур следует отметить наличие достаточно большого числа регистров (в типовых RISC-процессорах реализуются 32 или большее число регистров по сравнению с 8-16 регистрами в CISC-архитектурах), что позволяет большему объему данных храниться в регистрах на процессорном кристалле большее время и упрощает работу компилятора по распределению регистров под переменные. Для обработки, как правило, используются трехадресные команды, что помимо упрощения дешифрации дает возможность сохранять большее число переменных в регистрах без их последующей перезагрузки.

Развитие архитектуры RISC в значительной степени определялось прогрессом в области создания оптимизирующих компиляторов. Именно современная техника компиляции позволяет эффективно использовать преимущества большего регистрового файла, конвейерной организации и большей скорости выполнения команд. Современные компиляторы используют также преимущества другой оптимизационной техники для повышения производительности, обычно применяемой в процессорах RISC: реализацию задержанных переходов и суперскалярной обработки, позволяющей в один и тот же момент времени выдавать на выполнение несколько команд.

Следует отметить, что в последних разработках компании Intel (имеется в виду Pentium P54C и процессор следующего поколения P6), а также ее последователей-конкурентов (AMD R5, Cyrix M1, NexGen Nx586 и др.) широко используются идеи, реализованные в RISC-микропроцессорах, так что многие различия между CISC и RISC стираются. Однако сложность архитектуры и системы команд х86 остается и является главным фактором, ограничивающим производительность процессора на ее основе.

Лекция № 2.4. Сравнительные характеристики современных аппаратных платформ.

Особенности архитектуры MIPS компании MIPS Technology.

Затем на смену микропроцессорам семейства R3000 пришли новые 64-битовые микропроцессоры R4000 и R4400 (MIPS Technology была первой компанией, выпустившей процессоры с 64-битовой архитектурой).

В середине 1994 года компания MIPS анонсировала процессор R8000, который прежде всего был ориентирован на научные прикладные задачи с интенсивным использованием операций с плавающей точкой. Например, процессоры R8000 используются в системе Power Challenge компании Silicon Graphics, которая вполне может сравниться по производительности с известными супер-компьютерами Cray Y-MP, имеет на порядок меньшую стоимость и предъявляет значительно меньшие требования к подсистемам питания и охлаждения.

В 1994 году MIPS Technology объявила также о создании своего нового суперскалярного процессора R10000, начало массовых поставок которого ожидалось в конце 1995 года.

Сейчас MIPS вошла в состав SGI. Процессоры применяются только в рабочих станциях и серверах фирмы.

Особенности архитектуры Alpha компании DEC.

В настоящее время семейство микропроцессоров с архитектурой Alpha представлено несколькими кристаллами, имеющими различные диапазоны производительности, работающие с разной тактовой частотой и рассеивающие разную мощность.

Первым на рынке появился 64-разрядный микропроцессор Alpha (DECchip 21064). Он представляет собой RISC-процессор в однокристальном исполнении. Микропроцессор Alpha 21164 представляет собой вторую полностью новую реализацию архитектуры Alpha.

Переход в 1996 году на 0.35 микронную КМОП технологию привел к возможности дальнейшего увеличения тактовой частоты и производительности процессора. В настоящее время процессоры 21164 выпускаются с тактовой частотой 500 МГц (15.4 SPECint95, 21.1 SPECfp95).

В 1998 году компания DEC была куплена корпорацией Compaq. Появилось на свет новое семейство микропроцессоров Alpha 21264, который является самым быстрым в мире на данный момент. Фирма DEC обладает передовой технологией, которая позволяла ей выпустить процессор с тактовой частотой еще года два назад, но финансовые проблемы не позволили ей этого сделать . С момента приобретения, ситуация с процессором особенно не прояснилась.

Особенности архитектуры POWER компании IBM и PowerPC компаний Motorola, Aplle и IBM, PowerPC, Power2, Power3.

Как уже было отмечено, одним из разработчиков фундаментальной концепции RISC-архитектуры был Джон Кук из Исследовательского центра IBM им.Уотсона, который в середине 70-х проводил исследования в этом направлении и построил миникомпьютер IBM 801, который так никогда и не появился на рынке. Дальнейшее развитие этих идей в компании IBM нашло отражение при разработке архитектуры POWER в конце 80-х. Архитектура POWER (и ее поднаправления POWER2 и PowerPC) в настоящее время являются основой семейства рабочих станций и серверов RISC System/6000 компании IBM.

Первая реализация архитектуры POWER появилась на рынке в 1990 году. С тех пор компания IBM представила на рынок еще две версии процессоров POWER2 и POWER2+.

Компания IBM распространяет влияние архитектуры POWER в направлении малых систем с помощью платформы PowerPC. Архитектура POWER в этой форме может обеспечивать уровень производительности и масштабируемость, превышающие возможности современных персональных компьютеров. PowerPC базируется на платформе RS/6000 в дешевой конфигурации. В архитектурном плане основные отличия этих двух разработок заключаются лишь в том, что системы PowerPC используют однокристальную реализацию архитектуры POWER, изготавливаемую компанией Motorola, в то время как большинство систем RS/6000 используют многокристальную реализацию.

При разработке архитектуры PowerPC для удовлетворения потребностей трех различных компаний (Aplle, IBM и Motorola) при сохранении совместимости с RS/6000, в архитектуре POWER было сделано несколько изменений.

Процессоры PA-RISC компании Hewlett-Packard.

Основой разработки современных изделий Hewlett-Packard является архитектура PA-RISC. Она была разработана компанией в 1986 году и с тех пор прошла несколько стадий своего развития благодаря успехам интегральной технологии от многокристального до однокристального исполнения. В сентябре 1992 года компания Hewlett-Packard объявила о создании своего суперскалярного процессора PA-7100.

Кроме того, Hewlett-Packard в сотрудничестве с Intel планируют создать новый процессор с очень длинным командным словом (VLIM-архитектура), который будет совместим как с семейством Intel x86, так и с семейством PA-RISC. Выпуск этого процессора планировался на середину 2000 года. Название Merced. На данный момент основными процессорами являются 8000 и 8200.

Особенности процессоров с архитектурой SPARC компании Sun Microsystems.

Масштабируемая процессорная архитектура SPARC (Scalable Processor Architecture) компании Sun Microsystems является наиболее широко распространенной RISCC-архитектурой, отражающей доминирующее положение компании на рынке UNIX рабочих станций и серверов. Процессоры с архитектурой SPARC лицензированы и изготавливаются по спецификациям Sun несколькими производителями, среди которых следует отметить компании Texac Instruments, Fujitsu, LSI Logic, Bipolar International Technology, Philips, Cypruss Semiconducctor и Ross Technologies. Эти компании осуществляют поставки процессоров SPARC не только самой Sun Microsystems, но и другим изместным производителям вычислительных систем, например, Solbourne, Toshiba, Matsushita, Tatung и Cray Research.

Первоначально архитектура SPARC была разработана с целью упрощения реализации 32-битового процессора. Впоследствии, по мере улучшения технологии изготовления интегральных схем, она постепенно развивалось и в настоящее время имеется 64-битовая версия этой архитектуры (SPARC-V9), которая положена в основу новых микропроцессоров, получивших название UltraSPARC.

Таким образом, компания Sun Microsystems в настоящее время обладает широчайшим спектром процессоров, способных удовлетворить нужды практически любого пользователя как с точки зрения производительности выпускаемых ею рабочих станций и серверов, так и в отношении их стоимости, и, судя по всему, не собирается уступать своих позиций на быстро меняющемся компьютерном рынке.

Процессоры с архитектурой 80*86 и Pentium, Pentium III.

Обычно, когда новая архитектура создается одним архитектором или группой архитекторов, ее отдельные части очень хорошо подогнаны друг к другу и вся архитектура может быть описана достаточно связано. Этого нельзя сказать об архитектуре 80*86, поскольку это продукт нескольких независимых групп разработчиков, которые развивали эту архитектуру более 15 лет, добавляя новые возможности к первоначальному набору команд.

В 1978 году была анонсирована архитектура Intel 8086 как совместимое вверх расширение в то время успешного 8-бит микропроцессора 8080. 8086 представляет собой 16-битовую архитектуру.

Микропроцессор 8086 (точнее его версия 8088 с 8-битовой внешней шиной) стал основой завоевавшей впоследствии весь мир серии компьютеров IBM PC, работающих под управлением операционной системы MS-DOS. Анонсированный в 1982 году, микропроцессор 80286 еще дальше расширил архитектуру 8086. В 1984 году компания IBM объявила об использовании этого процессора в своей новой серии персональных компьютеров IBM PC/AT.

В 1987 году появился микропроцессор 80386, который расширил архитектуру 80286 до 32 бит. Также как и 80286, микропроцессор 80386 имеет режим выполнения программ, написанных для 8086. Хотя в то время базовой операционной системой для этих микропроцессоров оставалась MS-DOS, 32-разряд-ная архитектура и страничная организация памяти послужили основой для переноса на эту платформу операционной системы UNIX. Следует отметить, что для процессора 80286 была создана операционная система XENIX (сильно урезанный вариант системы UNIX).

Эта история иллюстрирует эффект, вызванный необходимостью обеспечения совместимости с 80*86, поскольку существовавшая база программного обеспечения на каждом шаге была слишком важной. К счастью, начиная с семейства процессоров i486 (i486SX, i486DX, i486DX2 и i486DX4), в котором сохранилась система команд и методы адресации процессора i386, уже имеет некоторые свойства RISC-микропроцессоров. Последующие процессоры (80486 в 1989 и Pentium в 1993 году) были нацелены на увеличение производительности и добавили к видимому пользователем набору команд только три новые команды, облегчающие организацию многопроцессорной работы.

Чтобы ни говорилось о неудобствах архитектуры 80886, следует иметь ввиду, что она преобладает в мире персональных компьютеров. Почти 80% установленных малых систем базируются именно на этой архитектуре. Споры относительно преимуществ CISC и RISC архитектур постепенно стихают, поскольку современные микропроцессоры стараются вобрать в себя наилучшие свойства обоих подходов.

В настоящее время компания Intel разработала и выпустила новые процессоры шестого поколения, продолжающие архитектурную линию х86. Первый процессор получил название P6 или Pentium Pro. Он работает с тактовыми частотами 150, 160, 180, 200, 400 и 600 МГц. Pentium Pro обеспечивает полную совместимость с процессорами предыдущих поколений. Он предназначен главным образом для поддержки высокопроизводительных 32-битовых вычислений в области САПР, трехмерной графики и мультимедиа, а также широкого круга коммерческих приложений баз данных.

Кроме того, в борьбу за новое поколение процессоров х86 включились компании, ранее занимавшиеся изготовлением Intel-совместимых процессоров. Это компании Advanced Micro Devices (AMD), Cyrix Corp и NexGen.

Процессоры K5 компании AMD используют в корне другой подход. Основа их процессоров – очень быстрое RISC-ядро, выполняющее высокорегулярные операции в суперскаляр-ном режиме. В процессорах K5 осуществляется аппаратная трансляция команд х86 в команды внутреннего формата, что дает лучшие условия для распараллеливания вычислений.

Сегментация.

С появлением процессора 6 поколения Pentium Pro картина начала меняться. Этот процессор, первоначально предназначавшийся для серверов и рабочих станций, так и не смог проникнуть на массовый рынок персональных компьютеров, что было связано с технологическими ограничениями. В процессоре использовалась встроенная кэш-память 2 уровня объемом 256 Кб. Хотя она изготавливалась на отдельном кристалле, при существовавшем тогда уровне технологии (0.5 мкм, а затем 0.35 мкм) добиться приемлемого снижения стоимости производства не удалось. Поэтому фирма Intel для следующих версий процессоров 6 поколения – Pentium II, не отказываясь от такого важного компонента, как встроенная кэш-память 2 уровня, выбрала другой путь, разделив производство собственно процессора (процессорного ядра) и кэш-памяти. Процессор из отдельной микросхемы превратился в модуль – печатную плату с установленным на ней процессорным ядром и микросхемами кэш-памяти. Появилась возможность, варьируя емкость и быстродействие кэш-памяти (и уровень цен) при сохранении одного и того же ядра, выпускать процессоры для разных сегментов рынка. Дальнейшее развитие технологии (переход от 0.35 мкм к 0.25 мкм) сделало возможным размещение кэш-памяти 2 уровня непосредственно на процессорном кристалле, что еще более расширило количество вариантов (позволило кроме модульной конструкции использовать и монолитную).

Начатая Intel целенаправленная сегментация процессоров, т.е. выпуск моделей, изначально ориентированных на разные сегменты рынка, вполне соответствует общей тенденции. Все более отчетливой сегментации компьютерного рынка в немалой степени способствуют, с одной стороны, определенные усилия самой компьютерной индустрии, сформулировавшей согласованные требования к компьютерам для разных групп пользователей и сфер применения (спецификации PC97, PC98, PC99), а с другой, - огромный интерес потребителей к наиболее дешевым моделям компьютеров (стоимостью менее 1000, 800, 600 и т.д. долларов).

Серьезность своих намерений по отношению к сегментации рынка фирма Intel подтвердила введением отдельных торговых марок: верхний уровень – это процессоры Xeon, нижний (базовый, стандартный) – Celeron, а максимально широкий центр – Pentium II. Следует отметить, что это разделение первоначально никак не было связано с уровнем архитектуры и технологии. Все это варианты процессора 6 поколения Pentium II, выпускаемые по единой технологии и, соответственно, очень близкие по производительности для широкого круга обычных задач. Но, в соответствии с реальными требованиями разных сегментов рынка, они представляют собой просто усложненные, нормальные или упрощенные варианты Pentium II. В дальнейшем процессоры, конечно, будут эволюционировать, но отдельные торговые марки для самых разных сегментов останутся.

Для процессоров, предназначенных для разных сегментов рынка, требование совместимости на уровне типов процессорного разъема (конструктива) не является обязательным, т.е. процессоры не обязаны быть взаимозаменяемыми. Более того, именно отличающийся конструктив становится одним из важнейших факторов, позволяющих фирме Intel добиться четкой сегментации (при очень сильном перекрытии сегментов теряется сам смысл сегментации).

Таким образом, классический вариант миграции, который наблюдался на протяжении последних лет, практически исключается. Исключается также во многих случаях и взаимозаменяемость между процессорами от разных производителей (Intel – не-Intel) даже в рамках одного и того же сегмента рынка, т.к. конструктив стал мощным инструментом конкурентной борьбы.

Перед пользователем теперь стоит проблема выбора не просто процессора с подходящим уровнем производительности, а платформы.

Технология.

Важнейшим фактором, обусловливающим непрерывный и быстрый рост производительности процессоров, является совершенствование технологии их производства. Уменьшение размера формируемых на полупроводниковом кристалле элементов приводит к возрастанию производительности (за счет более высоких тактовых частот) и достижимой степени интеграции, а также к снижению потребляемой мощности (из-за меньшего напряжения питания) и стоимости (из-за уменьшения размеров кристалла на одной пластине формируется большее число процессоров).

По уровню используемой технологии все производители процессоров достаточно близки. В настоящее время стандартной стала технология с 0.25 мкм проектными нормами, которая позволяет выпускать процессоры с тактовыми частотами 400-600 МГц (возможности используемой ранее 0.35 мкм технологии ограничены частотами около 300 МГц). Начинающаяся уже применяться 0.18 мкм технология обеспечивает тактовые частоты 600-800 МГц и более. Значительный прогресс ожидается от перехода к медным межсоединениям вместо алюминиевых. Так, фирма AMD, лицензировавшая медную технологию у фирмы Motorola, планирует к концу года достичь тактовых частот 1 ГГц, используя 0.18 мкм технологию с медными соединениями.

Процессоры фирмы Intel.

Все выпускаемые Intel в настоящее время семейства процессоров базируются на архитектуре 6 поколения P6. Выпуск процессоров 5 поколения, типа Pentium MMX, полностью прекращен. Некоторые характеристики процессоров Intel приведены в табл.2.

Процессоры Pentium II. Основой для всех выпускаемых Intel в настоящее время процессоров послужили процессоры Pentium II. И хотя они уже начали вытесняться процессорами Pentium III, их основные черты и пути развития будут в какой-то мере воспроизводиться последующими поколениями процессоров.

Первый вариант Pentium II на 233, 266 и 300 МГц рассчитан на частоту шины (или внешнюю тактовую частоту) 66 МГц.

Второй вариант Pentium II рассчитан на 100 МГц шину. Процессоры Pentium II на 233, 350, 400 и 450 МГц (частота шины у первого 66 МГц, у остальных – 100 МГц) содержат процессорное ядро Deschutes, которое отличается от Klamath только тем, что изготавливается по 0.25 мкм технологии.

Процессоры Pentium III. Процессоры Pentium III нацелены на те же сегменты рынка, что и Pentium II. Они, естественно, не конкурируют с Pentium II, а призваны просто заменить их. Главное отличите Pentium II заключается в использовании нового ядра Katmai. Кэш-память 2 уровня по-прежнему составляет 512 Кб и функционирует на вдвое меньшей частоте, чем ядро. Для производства Katmai используется 0.25 мкм технология, начиная с середины года будет осуществлен переход на 0.18 мкм проектные нормы (это уже будет ядро Coppermine). Kanmai от Deschutes отличается наличием блока SSE.

Процессоры Celeron. Процессор Celeron создавался как более дешевый вариант Pentium II, нацеленный на компьютеры базового уровня. Частота шины выбрана равной 66 МГц, что позволяет использовать более дешевые системные платы. Первая версия процессора Celeron (кодовое название Covington) выпускалась на тактовые частоты 266 и 300 МГц и представляла собой просто Pentium II без кэш-памяти 2 уровня.

Вторая версия процессора Celeron – это тоже печатная плата с припаянным на нее процессорным ядром, но уже не Deschutes, а Mendocino. Выполнено ядро Mendocino по 0.25 мкм технологии и отличается от Deschutes наличием интегрированной полноскоростной кэш-памяти 2 уровня объемом 128 Кб. Процессоры Celeron пока выпускаются на тактовых частотах 300, 333, 366, 400, 466 МГц.

Процессоры Xeon. Процессоры Xeon ориентированы на рынок серверов и рабочих станций серьезного уровня, для которых стоимость не является определяющим фактором. Поэтому в них использовано достаточно дорогостоящее решение – полноскоростная кэш-память 2 уровня большого объема (512 Кб, 1 и 2 Мб). Это позволило именно для этих условий применения добиться значи-тельного роста производительности даже в рамках архитектуры Pentium II (процессор Pentium II Xeon). В качестве ядра в процессорах Pentium II Xeon используется Deschutes.

Процессоры Pentium II Xeon имеют ряд дополнительных особенностей, учитывающих специфику сферы применения. Поддерживается многопроцессорный режим – до 8 процессоров и большой объем памяти – до 64 Гб.

В следующих версиях процессоров Xeon вместо ядра Deschutes будет, как и в Pentium III, использоваться Katmai, соответственно называться они будут Pentium III Xeon.

Процессоры фирмы AMD.

Процессоры K6-2. Процессоры K6-2ыпускаются на тактовые частоты 300, 333, 350, 380, 400 и 450 МГц. Все процессоры способны работать как с шиной 100 МГц, так и 66 МГц.

Поскольку по бизнес-приложениям K6-2 попадает в лидирующую группу, фирма AMD позиционирует его как гораздо более дешевую альтернативу Pentium III.

Процессоры K6-III. Процессор K6-III, известный также по кодовому имени Sharptooth, завершает развитие архитектуры K6.

Процессоры K6-III выпускаются по 0.25 мкм технологии на тактовые частоты 350, 380, 400 и 450 МГц. В дальнейшем ожидаются модели с частотой до 500 МГц. Напряжение питания K6-III составляет 2.3-2.5 В.

Процессор K7. Следующее семейство процессоров фирмы AMD, выпуск которых начнется в середине года, относится уже к 7 поколению и носит соответствующее название K7. Первые версии K7 будут производиться по 0.25 мкм технологии и иметь тактовые частоты 500 МГц и выше. В дальнейшем, с переходом на 0.18 мкм технологию и медные межсоединения, тактовая частота будет доведена до 1 ГГц.

Процессор K7 будет поддерживать многопроцессорность.

Сегментация и производительность.

Четкая сегментация облегчает проблему выбора процессора, но решающим остается такой фактор, как производительность. Однозначно ранжировать процессоры по уровню производительности практически невозможно, так как соотношение производительностей для разных процессоров сильно варьируется в зависимости от типа задачи. Поэтому, оставаясь в рамках существующей сегментации, естественно для оценки использовать некие типовые задачи, наиболее характерные для каждого сегмента. Для персонального компьютера типовой набор приложений выглядит примерно так:

- стандартный (базовый, начальный) уровень для дома – офисные приложения и игры, в меньшей степени графические приложения, для офиса – то же самое, но без игр;

- производительный уровень – опять офисные приложения, игры, больше графики;

- уровень High-End – в основном вычислительные и профессиональные графические приложения.

Взгляды на будущее.

В настоящее время фирма Intel контролирует примерно 75% рынка процессоров с архитектурой х86. Фирма FMD сумела отвоевать значительную часть рынка в сегменте компьютеров базового уровня и имеет хорошие шансы на сегментах более производительных компьютеров. Остальные производители пока реально претендуют только на самые дешевые компьютеры.

Ближайшее будущее процессоров фирмы AMD связано с развитием серии K7. Ожидается, что, начиная с 2000 года, произойдет переход на 0.18 мкм технологию и тактовая частота достигнет 1 ГГц. Сколько-нибудь достоверная информация о будущих процессорах других фирм пока отсутствует.

Память.

Возрастание скоростных характеристик процессоров требует и соответствующей реакции от подсистемы памяти. Память должна иметь достаточный объем и быстродействие при абсолютной надежности.

Объем.

Рекомендуемый объем памяти зависит, конечно, от того, для какого сегмента рынка предназначен компьютер. Более того. Именно способность надежно работать с памятью больших объемов является одним из наиболее важных отличий рабочих станций и серверов от обычных персональных компьютеров.

Рост рекомендуемых объемов памяти происходит практически автоматически по мере развития технологии и снижения цен на память.

Применение больших объемов памяти, 128 Мб и более, требует соблюдения ряда условий. Во-первых, кэш-память второго уровня должна кэшировать весь объем памяти, иначе упадет производительность. Во-вторых, должна использоваться коррекция ошибок или контроль четности, так как вероятность сбоя возрастает с увеличением объема памяти.

Пропускная способность и шина 100 МГц.

В современных системах в подавляющем большинстве случаев применяется синхронная динамическая память SDRAM. Она работает на частоте процессорной шины, которая и определяет максимальную пропускную способность памяти. Повышение частоты процессорной шины с 66 МГц до 1000 МГц подняло предел пропускной способности с 533 Мб/с (64 бит * 66.7 МГц) до 800 Мб/с (64 бит * 100 МГц), что, в свою очередь, привело к росту производительности.

Для памяти, предназначенной для работы на частоте процессорной шины 100 МГц, фирмой Intel разработана спецификация PC100 (название очень похоже на PC97, PC98, PC99, но это абсолютно разные вещи), выполнение которой производителями памяти гарантирует полную совместимость со 100 МГц системными платами. В случае использования больших объемов памяти для повышения надежности, применяется контроль четности и коррекция ошибок – ECC (Error Checking and Correction).

Direct Rambus DRAM.

Из возможных кандидатов на роль памяти для будущих систем фирма Intel выбрала память типа DRDRAM (Direct Rambus DRAM) и получила поддержку от всех ведущих мировых производителей памяти, так что пропускная способность составляет 1.6 Гб/с.

Жесткие диски.

Жесткие диски делятся на два больших класса – с интерфейсом IDE (ATA) для массовых персональных компьютеров и с интерфейсом SCSI для компьютеров с повышенными требованиями к дисковой подсистеме, например, серверов. Это соответственно 90 и 10% рынка. Такое разделение основывается на фундаментальных отличиях в свойствах интерфейса, которые не могут быть полностью преодолены. То есть интерфейс IDE не сможет стать достаточно эффективным для многопоточных и многозадачных приложений, а интерфейс SCSI не станет достаточно дешевым для применения в массовых системах.

Основанное преимущественно на типе интерфейса, разграничение жестких дисков по разным сферам применения приводит к заметной их дифференциации и по другим параметрам. Жесткие диски с интерфейсом SCSI обладают в целом более высокими характеристиками, чем диски с интерфейсом IDE. Для них достигнуты большие значения емкости и скорости вращения, лучшие значения времени доступа. Естественно, они являются и более дорогими. Жесткие диски с интерфейсом SCSI по большинству характеристик в целом отстают совсем не на много, но имеют гораздо более привлекательную стоимость. Причем, при равных основных характеристиках Жесткие диски с интерфейсом IDE при работе под Windows 95/98 по производительности обычно несколько опережают жесткие диски с интерфейсом SCSI, то есть применять жесткие диски SCSI надо только там, где это действительно необходимо.

Общее направление развития жестких дисков, независимо от принадлежности их к тому или иному классу. – это рост емкости, производительности и надежности. Причем, наблюдается настоящая технологическая гонка, которая затрагивает такие основные факторы, как плотность записи, скорость вращения, скорость передачи интерфейса, специальные решения для повышения надежности.

Интерфейсы.

SCSI. Основное преимущество SCSI интерфейса – возможность одновременного эффективного обслуживания нескольких устройств (до 15) – может быть в полной мере реализовано только при достаточной полосе пропускания, значительно превышающей требования каждого конкретного устройства. Нижний допустимый предел для жестких дисков определяется внутренней скоростью передачи, то есть скоростью поступления информации с носителя. В современных жестких дисках эта скорость превышает 4 Мб/с и продолжает увеличиваться по мере возрастания плотности записи и скорости вращения. Поэтому, производители жестких дисков практически полностью отказались от использования в новых моделях 8-разрядного интерфейса Ultra2SCSI, 80 Мб/с. Близок к началу использования и еще более скоростной вариант – Ultra160/m (Ultra3SCSI).

IDE. По скорости передачи интерфейс IDE мало отстает от SCSI. В ответ на появление UltraSCSI со скоростью передачи 40 Мбc фирма Quantum предложила в свое время для IDE спецификацию UltraATA/33 (UltraATA), 33 Мб/с. Она получила всеобщую поддержку и используется сейчас во всех жестких дисках с интерфейсом IDE. В ответ на появление Ultra2SCSI со скоростью 80 Мб/с и на возрастание внутренней скорости передачи жестких дисков фирма Quantum предложила спецификацию – UltraATA/66, со скоростью передачи 66 Мб/с за счет исключения переполнения буфера.

IEEE 1394 и Device-Bay. UltraATA/66 – это очередной эволюционный шаг в развитии IDE интерфейса.

Но уже ожидается следующий и вполне революционный шаг – переход от IDE к последовательному интерфейсу IEEE 1394, известному также как Fire Wire. Высокоскоростной интерфейс IEEE 1 (скорость передачи в разных вариантах 50, 240, 1000 и даже 3200 Мбит/с) предусматривает единый способ подключения для множества скоростных устройств. Это могут быть жесткие диски, приводы CD-ROM, мультимедийное аудио и видеооборудование, принтеры, сканеры и многие другие устройства.

Надежность.

Для жесткого диска, являющегося устройством хранения информации, на первый план выдвигается такое качество, как надежность. Жесткий диск должен работать стабильно, без сбоев и полностью гарантировать доступ к данным и сохранение их целостности. Надежная работа жесткого диска обеспечивается как производителем, так и потребителем.

Производитель обеспечивает надежность конструктивными и технологическими мерами, подтверждает высокими значениями среднего времени наработки на отказ 300 000-1 000 000 часов и длительным сроком гарантии – 2-5 лет. Жесткие диски с интерфейсом SCSI имеют время наработки на отказ 500 000 – 1 000 000 часов, с интерфейсом IDE 300 000 – 500 000. Следует иметь в виду, что время наработки на отказ – это чисто статистический показатель, характеризующий всю совокупность жестких дисков. По нему можно оценить вероятность выхода из строя в течение срока эксплуатации. Например, при среднем времени наработки на отказ 300 000 часов (это 34 года) за 1 000 часов эксплуатации выйдет из строя 0.3% дисков.

Парамагнитный предел и оптические технологии.

Магнитная технология имеет хороший потенциал увеличения плотности записи, и нынешние темпы роста емкости жестких дисков сохранятся еще в течение нескольких лет. Однако существует и принципиальное ограничение на увеличение плотности записи – так называемый парамагнитный предел, связанный с потерей устойчивости магнитных доменов. Для традиционной магнитной технологии с горизонтальной записью он соответствует примерно 20-40 Мбит/кв.дюйм. Достичь этих значений и даже несколько превысить их позволяет новая магнитооптическая технология, использующая вертикальную запись. О разработке этой технологии сообщила фирма Quinta, являющаяся подразделением Seagate. Эта технология названа OAW (Optically Assisted Winchester).

В жестких дисках OAW вместо обычной магнитной головки используется комбинация магнитной и очень миниатюрной оптической головок. Оптическая головка состоит из линзы диаметром около 300 мкм и управляемого зеркала, выполненного по твердотельной технологии. Лазерный луч подается на головку с помошью тонкого световолокна. Система позиционирования – двухстепенная: актуатор типа voice coil, на котором расположена головка, и электрически управляемое зеркало. Предполагается, что плотность дорожек достигнет 100 000 на дюйм (пока в жестких дисках – не более 15 000). Запись и чтение основываются на магнитооптической технологии. Запись – нагрев лазерным лучом и намагничивание, чтение – детектирование изменения поляризации луча при отражении от намагниченного участка. Высокой плотности записи способствует применение магнитного слоя из аморфных материалов. Сам носитель – пластмассовый, что способствует снижению стоимости.

Первые изделия должны появиться уже в текущем году. Насколько эта технология перспективна – покажет время. Конкурировать с обычными жесткими дисками пока очень трудно.

CD и DVD.

Технология лазерных компакт-дисков продолжает развиваться сразу в нескольких направлениях. Это CD-ROM, DVD-ROM, устройства с однократной и многократной записью CD-R и CD-RW, перезаписываемые DVD. Данные по объемам выпуска представлены на рис.1.

CD-ROM Современные приводы CD-ROM по

80 - максимальной скорости считывания данных превосходит

устройства первого поколения в 32-50 раз (32-50х, где 1х

60 - DVD-Rec соответствует 150 Кб/с). Реальное же превосходство не

DVD-ROM столь велико, хотя тоже очень значительно. В отличие от

40 - CD-RW устройств первых поколений, работавших с постоянной

CD-ROM линейной скоростью – CLV (Constant Linear Velocity),

20 – теперь повсеместно используется режим с постоянной

угловой скоростью - CAV (Constant Angular Velocity).

| | | |

0 97 98 99 00

Рис.1. По данным IDS.

В этом режиме скорость вращения диска не меняется, а скорость считывания пропорциональна радиусу. То есть, максимальная скорость чтения достигается на периферийных участках дисков (4.8-7.5 Мб/с), для внутренних участков она существенно меньше (2.3-3.3 Мб/с). поскольку заполнение диска начинается с внутренних областей, и диски обычно заполнены не полностью, то средняя скорость считывания гораздо ближе к минимальному значению, чем к среднему. Увеличение скорости чтения приводов CD-ROM - это фактически единственное направление их совершенствования.

CD-R.

Увеличение скорости записи для устройств CD-R (с однократной записью) дается намного труднее, чем увеличение скорости чтения для CD-ROM, так как требования к стабильности механического тракта гораздо выше, и обеспечить необходимые параметры при высоких скоростях вращения довольно трудно. За все время существования устройств CD-R пройдено всего 3 этапа, соответствующих скоростям записи 1х, 2х и 4х. Сейчас начинается 4-й этап – появились первые устройства со скоростью записи 8х.

CD-RW.

По стоимости устройства с многократной перезаписью CD-RW достигли уже уровня CD-R и цены продолжают снижаться. Скоростные характеристики растут и практически готовы достичь показателей лучших моделей CD-R (для CD-RW со скоростью записи 8х уже разработаны лазеры и электронные схемы). Пока же максимальная скорость записи для дисков CD-RW составляет 4х, а для большинства моделей она остается на уровне 2х. Устройства CD-RW позволяют записывать также диски CD-R, максимальное значение скорости записи пока составляет 4х. Скорость чтения дисков CD-ROM в последних моделях увеличена до 16х-20х, для дисков CD-RW – до 8х (следует отметить, что диски CD-RW даже на самых скоростных приводах CD-ROM воспроизводятся с меньшей скоростью, чем CD-ROM и CD-R, также не более 8х).

Модели самого высокого класса описываются формулой 4/4/>16, где первое число означает скорость записи CD-R, второе – скорость записи CD-RW и третье – максимальную скорость чтения.

DVD.

Устройства для чтения дисков высокой плотности DVD-ROM по техническим характеристикам, объемам выпуска и цене достигли, наконец, степени полной готовности к быстрому и массовому внедрению в компьютеры любого уровня (объем информации от 4.7 Гб до 17 Гб). Первое поколение устройств DVD-ROM использовало режим CLV и имело скорость чтения информации с диска DVD 1.38 Мб/с (это 1х для DVD).

Для DVD разработано несколько типов устройств с функцией записи: DVD-R (с однократной записью), DVD-RAM и DVD-RW (с многократной).

Мониторы.

Монитор является важнейшей частью графической системы компьютера. Перед экраном компьютера многие пользователи проводят по несколько часов в день, что и определяет повышенный уровень требований к качеству изображения, эргономичности и безопасности. Качество изображения является ключевым фактором, от которого зависят и все остальные (важнейшая составляющая эргономичности – отсутствие дискомфортных ощущений, которые всегда возникают при рассматривании изображения недостаточного качества.

Важнейшая составляющая безопасности – безопасность для зрения, т.е. отсутствие чрезмерного напряжения зрения из-за мерцающего и нечеткого изображения). Эргономичность. Кроме того, предполагает и другие специальные требования к дизайну, повышающие удобство в работе. Безопасность вообще рассматривается очень широко и затрагивает также потенциальные риски от монитора как от источника излучений и как загрязнителя окружающей среды.

Экраны.

Основным элементов монитора, определяющим его технические параметры и потребительские свойства, является устройство отображения.

ЭЛТ. Мониторы на ЭЛТ пока остаются вне конкуренции по уровню цен. Цены продолжают снижаться, а технические параметры постоянно возрастают. Даже в такой консервативный элемент, как ЭЛТ, постоянно вносятся усовершенствования. Основных направлений совершенствования всего два, так как у ЭЛТ всего два заметных недостатка.

Первый – это относительная громоздкость.

Второй недостаток, который стал более заметным с появлением плоских экранов. – это неплоский экран.

Плоские панели. Плоские панели или экраны матричного типа могут основываться на разных технологиях: жидкокристаллической, плазменной, твердотельной, автоэлектронноэмиссионной и других.

Плоские жидкокристаллические панели имеют целый ряд потребительских качеств, делающих их особенно привлекательными:

- абсолютно плоский экран;

- отсутствие геометрических искажений;

- высокая яркость;

- малая глубина, компактность;

- очень низкий уровень электромагнитных излучений.

Не лишены жидкокристаллические панели и некоторых недостатков, среди которых меньшее, чем у ЭЛТ, быстродействие (время переключения элементов), ограниченный угол обзора по горизонтали и вертикали.

Устройства со сменными магнитными носителями.

Флоппи-диски.

Дисководы 3.5 дюймовых флоппи-дисков (FDD), разработанные фирмой Sony в 1980 году, за все последующие годы выпуска не претерпели никаких существенных изменений и выглядят сейчас совсем устаревшими, имея слишком маленькую емкость носителей (1.44 Мб) и низкое быстродействие. Неоднократно предпринимались попытки предложить замену, но ни одну из них нельзя признать вполне удавшейся. Наибольший успех выпал на долю дисководов ZIP фирмы Lomega, имеющих достаточно большую емкость – 100 Мб (сейчас уже начался выпуск новой модели ZIP250 емкостью 250 Мб) и хорошее быстродействие. Всего продано более 20 млн. дисководов, что не идет пока ни в какое сравнение с рынком FDD (120 млн. в год). Основным недостатком дисководов ZIP, практически лишивших их шансов занять место FDD, является несовместимость с обычными флоппи-дисками.

TCO’92/95/99.

Слово безопасность применительно к профессиональному инструменту или предмету обихода многих невольно настораживает (ведь там, где говорят о безопасности, может быть и опасность). Конечно, никакой опасности для пользователя современные мониторы не представляют. Во всяком случае, они не более опасны, чем другие устройства, например, клавиатура. Тем не менее, производители стремятся еще более уменьшить потенциальные риски, а гарантом такого правильного подхода для пользователя является соответствующий сертификат какой-либо авторитетной организации, например, шведской конфедерации профессиональных работников – ТСО.

Стандарты ТСО регламентируют уровень электромагнитных излучений, энергопотребление, эргономичность и экологическую чистоту и нацелены на создание достойных условий работы для профессиональных пользователей, работающих у экрана полный рабочий день. В настоящее время используются стандарты ТСО’92, ТСО’95, ТСО’99. Стандарт ТСО’92 распространяется только на мониторы, ТСО’95 охватывает также клавиатуры и системные блоки, в ТСО’99 добавлены еще и мобильные компьютеры. Эргономические и экологические требования введены, начиная с ТСО’95.

Требования к уровню низкочастотных электромагнитных излучений у всех стандартов ТСО абсолютно одинаковые и существенно более жесткие, чем у предшествующего стандарта MPR-11. Сами регламентированные значения не есть результат каких-либо научных исследований (неоднократно подчеркивалось, что никаких достоверных научных доказательств негативного влияния низкоуровневых низкочастотных электромагнитных излучений на здоровье нет), а выбраны как бы от достигнутого (сравнивалось некоторое количество имеющихся на рынке на момент разработки стандарта моделей мониторов, и за основу были взяты минимальные значения). Поэтому повышенное внимание к этим показателям вряд ли оправдано, тем более, что на практике уровень электромагнитных излучений сильно зависит от наличия заземляющего контакта в цепи питания.

Требования к энергопотреблению, эргономике и экологии последовательно ожесточались. В ТСО’99 уменьшено энергопотребление в режиме standby и введены ограничения на время перехода в нормальный режим (не более 3 секунд). Усилены требования к качеству изображения (яркости, контрастности, мерцанию и отражательной способности экрана). Дополнены требования к используемым в мониторе материалам с точки зрения процесса производства и последующей, после окончания эксплуатации, утилизации.

Основные классы современных параллельных компьютеров.

Основным параметром классификации параллельных компьютеров является наличие общей (SMP) или распределенной (MPP) памяти. Нечто среднее между SMP и MPP представляют собой NUMA-архитектуры, где память физически распределена, но логически общедоступна. Кластерные системы являются более дешевым вариантом MPP. При поддержке команд обработки векторных данных говорят о векторно-конвейерных процессорах, которые, в свою очередь, могут объединяться в PVP-системы с использованием общей или распределенной памяти. Все большую популярность приобретают идеи комбинирования различных архитектур в одной системе и построения неоднородных систем.

При организации распределенных вычислений в глобальных сетях (Интернет) говорят о мета-компьютерах, которые, строго говоря, не представляют из себя параллельных архитектур. Этот термин возник вместе с развитием высокоскоростной сетевой инфраструктуры в начале 90-х годов и относился к объединению нескольких разнородных вычислительных ресурсов в локальной сети организации для решения одной задачи. Основная цель построения мета-компьютеров в то время заключалась в оптимальном распределении частей работы по вычислительным системам различной архитектуры и различной мощности. Например, предварительная обработка данных и генерация сеток для счета могли производиться на пользовательской рабочей станции, основное моделирование на векторно-конвейерном суперкомпьютере, решение больших систем линейных уравнений – на массивно-параллельной системе, а визуализация результатов – на специальной графической станции.

В дальнейшем, исследования в области технологий мета-компьютинга были развиты в сторону однородного доступа к вычислительным ресурсам большого числа (вплоть до нескольких тысяч) компьютеров в локальной или глобальной сети. Компонентами “мета-компьютера” могут быть как простейшие ПК, так и мощные массивно-параллельные системы. Что важно, мета - компьютер может не иметь постоянной конфигурации – отдельные компоненты могут включаться в его конфигурацию или отключаться от нее; при этом технологии мета-компьютинга обеспечивают непрерывное функционирование системы в целом. Современные исследовательские проекты в этой области направлены на обеспечение прозрачного доступа пользователей через Интернет к необходимым вычислительным ресурсам, а также прозрачного подключения простаивающих вычислительных систем к компьютерам.

Очевидно, что наилучшим образом для решения на мета-компьютерах подходят задачи переборного и поискового типа, где вычислительные узлы практически не взаимодействуют друг с другом и основную часть работы производят в автономном режиме. Основная схема работы в этом случае примерно такая: специальный агент, расположенный на вычислительном узле (компьютере пользователя), определяет факт простоя этого компьютера, соединяется с управляющим узлом мета-компьютера и получает от него очередную порцию работы (область в пространстве перебора). По окончании счета по данной порции вычислительный узел передает обратно отчет о фактически проделанном переборе или сигнал о достижении цели поиска.

Более подробно особенности всех перечисленных архитектур рассмотрены в описаниях конкретных компьютеров – представителей этих классов. Для каждого класса приводится следующая информация:

  • краткое описание особенностей архитектуры;

  • примеры конкретных компьютеров;

  • перспективы масштабируемости;

  • типичные особенности построения операционных систем;

  • наиболее характерная модель программирования (хотя возможны и другие).

Массивно-параллельные системы (MPP)

Архитекту-ра

Система состоит из однородных вычислительных узлов, включающих:

- один или несколько центральных процессоров (обычно RISC);

- локальную память (прямой доступ к памяти других узлов невозможен);

- коммуникационный процессор или сетевой адаптер;

- иногда – жесткие диски (как в SP) и/или другие устройства В/В.

К системе могут быть добавлены специальные узлы ввода/вывода и управляющие узлы. Узлы связаны через некоторую коммуникационную среду (высокоскоростная сеть, коммутатор и т.п.).

Примеры

IBM RS/6000 SP2, Intel PARAGON/ASCCI Red, SGI/CRAY T3E, транспьютерные системы Parsytec.

Масштаби-руемость

Общее число процессоров в реальных системах достигает нескольких тысяч (ASCI Red, Blue Moutain).

Операцион-ная система

Существуют два основных варианта:

1. Полноценная ОС работает только на управляющей машине (front-end), на каждом узле работает сильно урезанный вариант ОС, обеспечивающие только работу расположенной в нем ветви параллельного приложения.

Пример: Cray T3Y.

2. На каждом узле работает полноценная UNIX-подобная ОС (вариант, близкий к кластерному подходу). Пример: IBM RS/6000 SP + OC AIX, устанавливаемая отдельно на каждом узле.

Модель программи-рования

Программирование в рамках модели передачи сообщений (MPI, PVM, BSPlib).

Симметричные мультипроцессорные системы (SMP)

Архитекту-ра

Система состоит из нескольких однородных процессоров и массива общей памяти (обычно из нескольких независимых блоков). Все процессоры имеют доступ к любой точке памяти с одинаковой скоростью.

Примеры

HP9000 V-class, N-class, SMP-сервера и рабочие станции на базе процессоров Intel (IBM, HP, Compaq, Dell, ALR, Unisys, DG, Fujitsu и др.).

Массштаби-руемость

Наличие общей памяти упрощает взаимодействие процессоров между собой, однако накладывает сильные ограничения на их число – не более 32 в реаль-ных системах. Для построения масштабируемых систем на базе SMP исполь-зуются кластерные или NUMA-архитектуры.

Операцион-ная система

Вся система работает под управлением единой ОС (обычно UNIX-подобной, но для Intel-платформ поддерживается Windows NT). ОС автоматически (в процессе работы) распределяет процессы/нити по процессорам (scheduling), но иногда возможна и явная привязка.

Модель программи-рования

Программирование в модели общей памяти (POSIX threads, OpenMP). Для SMP-систем существуют сравнительно эффективные средства автоматического распараллеливания.

Системы с неоднородным доступом к памяти (NUMA)

Архитекту-ра

Система состоит из однородных базовых модулей (плат), состоящих из небольшого числа процессоров и блока памяти. Модели объединены с помощью высокоскоростного коммутатора. Поддерживается единое адресное пространство, аппаратно поддерживается доступ к удаленной памяти, т.е. к памяти других модулей. При этом доступ к локальной памяти в несколько раз быстрее, чем к удаленной.

В случае, если аппаратно поддерживается когерентность кэшей во всей системе (обычно это так), говорят об архитектуре с-NUMA (cache-coherent NUMA).

Примеры

HP HP9000 V-class в SCA-конфигурациях, SGI Origin2000, Sun HPC10000, IBM/Sequent NUMA-Q2000, SNI RM600.

Масштаби-руемость

Масштабируемость NUMA-систем ограничивается объемом адресного прост-ранства, возможностями аппаратуры поддержки когерентности кэшей и воз-можностями операционной системы по управлению большим числом процес-соров. На настоящий момент максимальное число процессоров в NUMA-сис-темах составляет 256 (Origin2000).

Операцион-ная система

Обычно вся система работает под управлением единой ОС, как в SMP. Но возможны также варианты динамического “подразделения” системы, когда отдельные “разделы” системы работают под управлением разных ОС (например, Windows NT и UNIX в NUMA-Q2000).

Модель програм-мирования

Аналогично SMP.

Параллельные векторные системы (PVP)

Архитекту-ра

Основным признаком PVP-систем является наличие специальных векторно-конвейерных процессоров, в которых предусмотрены команды однотипной обработки векторов независимых данных, эффективно выполняющиеся на конвейерных функциональных устройствах.

Как правило, несколько таких процессоров (1-16) работают одновременно над общей памятью (аналогично SMP) в рамках многопроцессорных конфигура-ций. Несколько таких узлов могут быть объединены с помощью коммутатора (аналогично MPP).

Примеры

NEC SX-4/SX-5, линия векторно-конвейерных компьютеров CRAY: от CRAY-1, CRAY J90/T90, CRAY SV1, серия Fujitsu VPP.

Модель програм-мирования

Эффективное программирование подразумевает векторизацию циклов (для достижения разумной производительности одного процессора) и их распарал-леливание (для одновременной загрузки нескольких процессоров одним приложением).

Кластерные системы

Архитекту-ра

Набор рабочих станций (или даже ПК) общего назначения, используется в качестве дешевого варианта массивно-параллельного компьютера. Для связи узлов используется одна из стандартных сетевых технологий.

При объединении в кластер компьютеров разной мощности или разной архи-тектуры говорят о гетерогенных (неоднородных) кластерах.

Примеры

NT-кластер в NCSA, Beowulf-кластеры.

Операцион-ная система

Используются стандартные для рабочих станций ОС, чаще всего, свободно распространяемые – Linux/FreeBSD, вместе со специальными средствами поддержки параллельного программирования и распределения нагрузки.

Модель програм-мирования

Программирование, как правило, в рамках модели передачи сообщений (чаще всего – MPI). Дешевизна подобных систем оборачивается большими наклад-ными расходами на взаимодействие параллельных процессов между собой, что сильно сужает потенциальный класс решаемых задач.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]