Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

информатика Лекции

.pdf
Скачиваний:
16
Добавлен:
21.03.2015
Размер:
912.67 Кб
Скачать

4. Кодирование графических данных

Если рассмотреть с помощью увеличительного стекла чёрно белое изображение, напечатанное на бумаге, то можно увидеть, что оно состоит из мельчайших точек, образующий характерный узор, называемый растром.

Растровое изображение представляет собой совокупность точек (пикселей) разных цветов.

Поскольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел, то можно сказать,

что растровые координирование позволяет использовать двоичный код для представления графических данных. Общепринятым на сегодняшний день считается представление чёрно белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и таким образом, для кодирования яркости любой точки обычно достаточно восьмиразрядного двоичного числа.

Для кодирования графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три основные цвета:

красный – (Red, R);

зелёный – (Green, G);

синий – (Blue, B);

На практике считается (хотя теоретически это не совсем так), что любой цвет, видимый человеческим глазом, можно получить путём механического смешивания этих трёх основных цветов. Такая система называется RGB по первым буквам названий основного цвета.

Если для кодирования яркости каждой из основных составляющих использовать 256 значений (восемь двоичных разрядов), как принято в полутоновых чёрно белых изображений, то на кодирования цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,8 млн различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным

(True Color).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет

11

цвет, образованный суммой пары остальных основных цветов. Соответственно дополнительными цветами являются:

голубой (Cyan, C);

пурпуровый (Magenta, M);

жёлтый (Yellow, Y).

Принцип декомпозиции произвольного цвета на составляющие компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпуровой и жёлтой составляющей. Такой метод кодирования цвета принят в полиграфии, но полиграфии используется и ещё и четвёртая краска чёрная (Black, B). Поэтому данная система кодирования обозначается четырьмя буквами CMYK (чёрный цвет обозначается буквой K, потому, что буква B уже занята синим цветом), и для представления цветовой графики в этой системе координат надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным (True Color).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объём данных, но при этом диапазон кодированных цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом

High Color.

При кодировании информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков. Такой метод кодирования называется индексным. Смысл названия в том, что поскольку 256 значений совершенно не достаточно, что передать весь диапазон цветов, а только его номер (индекс) в некой справочной таблице называемой палитрой. Разумеется эта палитра должна прикладываться графическим данным без неё нельзя воспользоваться методами на экране или бумаге (то есть, воспользоваться, конечно, можно, но из-за неполноты данных полученная информация не будет адекватной: листва на деревьях может оказаться красной, а небо зеленным).

12

5. Кодирование звуковой информации

Приёмы и методы работы со звуковой информацией в вычислительную техники наиболее поздно. К тому же, в отличии от числовых, текстовых и графических данных, у звукозаписей не было столь же длительной и проверенной истории кодирования. В итоге методы кодирования звуковой информации далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, но если говорить обобщенно, то можно выделить два основных направления.

Метод FM (Frequency Modulation) основан на том, что любой сложный

звук можно разбить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет правильную синусоиду, а следовательно, может быть описан числовыми параметрами, то есть кодом. В природе звуковые сигналы имеют непрерывный спектр, то есть являются аналоговыми. Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства

аналого-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированным двоичным кодом, выполняют цифроаналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потери информации, связанные с методами кодирования, поэтому качество звукозаписи обычно получается не вполне удовлетворительным, соответствует качеству простейших музыкальных инструментов с окрасом, характерным для электронной музыки. В то же время, данный метод кодирования обеспечивает весьма компактный код, и поэтому нашёл применение ещё в те годы, когда ресурсы и средства вычислительной техники были явно недостаточны.

Метод таблично волнового (Wave-Table) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различных электромузыкальных инструментов (хотя не только для них). В технике такие образцы называются сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры его среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученное в результате синтеза, получается очень высоким и приближается к качеству реальных музыкальных инструментов.

13

6. Единицы представления данных. Единицы измерения данных

Единицы представления данных

Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным кодом, мы познакомились выше. Наименьшей единицей такого представления является бит (двоичный разряд). Совокупность двоичных разрядов, выражающих числовые или иные данные, образуют некий битовый рисунок. Практика показывает, что битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называют байтами.

Десятичное число

Двоичное число

Байт

1

1

0000 0001

2

10

0000 0010

255

11111111

1111 1111

Понятие о байте как о группе взаимосвязанных битов появились вместе с первыми образцами электронной вычислительной техники. Долгое время оно было машиннозависимым, то есть различных вычислительных машин длина байта была разной. Только в конце 60-х годов понятие байта стала универсальным и машиннонезависимым.

Выше мы видели, что во многих случаях целесообразно использовать не восьмиразрядное кодирование, 16-разрядное, 24-разрядное, 32-разрядное и более. Группа 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группа из четырёх взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группа из восьми байтов удвоенным (64 разряда) – учетверённым словом.

Единицы измерения данных

Существует много систем и единиц измерения данных. Каждая научная

дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные и традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют

универсальное двоичное представление и поэтому вводят свои единицы данных, основанные на нём.

Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для

текстовых документов размер в байтах соответствует лексическому объёму в символах (пока исключение составляет универсальная кодировка UNICODE).

Более крупная единица килобайт (Кбайт). Условно можно считать 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт

14

равен 210 байт (1024 байт). Однако всюду, где это не принципиально, с инженерной поганостью (до 3%) «забывают» о «лишних» байтах.

В килобайтах измеряют сравнительно небольшие объёмы данных. Условно можно считать, что одна страница неформатированного машинного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига-, тера-, пента-, экса-, зета-, йотта-.

Единицы

Значения

Метрический аналог

1

Кбайт

1024

байта (210 )

1000 (102)

1

Мбайт

1024

Кбайт (220 )

1000000 (106)

1

Гбайт

1024

Мбайт (230 )

109

1

Тбайт

1024

Гбайт (240)

1012

1

Пбайт

1024

Тбайт (250 )

1015

1

Эбайт

1024

Пбайт (260 )

1018

1

Збайт

1024

Эбайт (270)

1021

1

Йбайт

1024

Збайт (280)

1024

Особо обратим внимание на то, что при переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округления производятся реже.

15

7. Единицы хранения данных. Понятие о файловой структуре

Единицы хранения данных

При хранении данных решается две проблемы: как сохранить данные в наиболее компактном виде и как удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, что бы данные имели упорядоченную структуру, а при этом, образуется «паразитная нагрузка» виде адресных данных. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

Поскольку адресные данные то же имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких как байт, неудобно. Их неудобно хранить и в более крупных единицах (килобайт, мегабайт и т.п.),

поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.

Вкачестве единицы хранения данных принят объект переменной длины, называемый файлом.

Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

Проще всего представить себе файл виде безразмерного канцелярского досье, в которое можно пожеланию добавлять содержимое или извлекать оттуда. Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байт (пустой файл), и файл, имеющий любое число байтов.

Вопределении файл особое внимание уделяется имени. Оно фактически несёт в себе адресные данные, без которых данные, хранящиеся файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией имя файла может хранить и сведения о типе данных, заключённых в нём. Для автоматических средств работы с данными это важно,

поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.

Понятие о файловой структуре

Требование уникальности имени файла очевидна без этого невозможно гарантировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически создать файл с именем, тождественным уже имеющимся, не может ни пользователь, ни автоматика.

Хранение файла организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки) внутри которых могут быть созданы

вложенные каталоги (папки). Путь доступа к файлу начинается с имени

16

устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ «\» (обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путём доступа к нему.

Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественно полными именами.

Пример записи имени файла:

<имя носителя>\<имя каталога>\<имя каталога-N>\<собственное имя файла> C:\Мои документы\ИПФ\документ

17

8. Поколения вычислительной техники

Поколение вычислительных машин это сложившееся в последнее время

разбиение вычислительных машин на классы определяемые элементной базой и производительностью.

Нулевое поколение. (1938 – 1945). Элементная база электромеханическое реле. В 1943 году группа ученых Гарвардского

университета под руководством Говарда Айкена разработала вычислитель

ASSC Mark I (Automatic Sequence-Calculator Mark I) – первый программно управляемый вычислитель, получивший широкую известность.

Первое поколение (1945 – 1953). Элементная база электронные лампы,

Они обладали быстродействием в тысячу раз превышающих их электромеханических аналогов, хотя надежность оставалась низкой. Это эпоха становления вычислительной техники. Большинство машин первого поколения

были экспериментальными устройствами и создавались с целью проверки тех или иных теоретических положений. Вес и размеры этих компьютеров были такими, что они нередко требовали отдельных зданий.

Основоположниками компьютерной науки по праву считаются Клод Шеннон создатель теории информации, Алан Тьюринг математик, разработавший теорию программ и алгоритмов, и Джон фон Нейман автор конструкции вычислительных устройств, которая до настоящего времени лежит в основе большинства компьютеров. В те же годы возникла еще одна новая наука, связанная с информатикой, — кибернетика наука об управлении как одном из основных информационных процессов. Основателем кибернетики является американский математик Норберт Винер.

Во втором поколении (1954 – 1962) Элементная база полупроводниковые приборы. Вместо электронных ламп использовались транзисторы, а в качестве устройств памяти стали применяться магнитные сердечники и барабаны прототипы современных жестких дисков. Все это позволило сократить габариты и стоимость компьютеров, которые тогда впервые стали производиться на продажу.

Но главные достижения этой эпохи относятся к области программ. Во втором поколении впервые появилось то, что сегодня называется операционной системой. Тогда же были разработаны первые языки высокого уровня Фортран, Алгол, Кобол. Два этих важных усовершенствования позволили значительно упростить и ускорить написание программ для компьютеров.

При этом расширялась сфера применения компьютеров. Теперь уже не только ученые могли рассчитывать на доступ к вычислительной технике, поскольку компьютеры нашли применение в планировании и управлении, а

некоторые крупные фирмы даже начали компьютеризировать свою бухгалтерию, предвосхищая этот процесс на двадцать лет.

В третьем поколении (1965 – 1972) впервые стали использоваться интегральные схемы целые устройства и узлы из десятков и сотен

18

транзисторов, выполненные на одном кристалле полупроводника (микросхемы). В то же время появилась полупроводниковая память, которая и

до настоящего времени используется в персональных компьютерах в качестве оперативной.

Вте годы производство компьютеров приняло промышленный размах. Фирма IBM первой реализовала серию полностью совместимых друг с другом компьютеров от самых маленьких, размером с небольшой шкаф (меньше тогда еще не делали), до самых мощных и дорогих моделей. Наиболее распространенным в те годы было семейство System/360 фирмы IBM, на основе которого в СССР была разработана серия ЕС ЭВМ. Еще в начале 1960-х гг. появились первые миникомпьютеры маломощные компьютеры, доступные по цене небольшим фирмам или лабораториям. Мини-компьютеры были первым шагом на пути к персональным компьютерам, пробные образцы которых были выпущены только в середине 1970-х гг.

Между тем количество элементов и соединений, умещающихся в одной микросхеме, постоянно росло, и в 1970-е гг. интегральные схемы содержали уже тысячи транзисторов.

В1971 г. фирма Intel выпустила первый микропроцессор, который предназначался для только появившихся настольных калькуляторов. Это изобретение произвело в следующем десятилетии настоящую революцию.

Микропроцессор является главной составляющей частью современного персонального компьютера.

На рубеже 1960 —70-х гг. (1969) появилась первая глобальная компьютерная сеть ARPA, прототип современной сети Интернет. В том же 1969 г. одновременно появились операционная система Unix и язык программирования С ("Си"), оказавшие огромное влияние на программный мир

идо сих пор сохраняющие свое главенствующее положение.

Четвертое поколение (1975 – 1985) характеризуется небольшим количеством принципиальных новаций в компьютерной науке. Прогресс шел в основном по пути развития того, что уже изобретено и придумано, прежде всего, за счет повышения мощности и миниатюризации элементной базы и самих компьютеров.

Самая главная новация четвертого поколения это появление в начале 1980-х гг. персональных компьютеров. Благодаря им вычислительная техника становится по-настоящему массовой и общедоступной. Несмотря на то, что персональные и мини-компьютеры по-прежнему по вычислительной мощности отстают от солидных машин, большая часть новшеств, таких как графический пользовательский интерфейс, новые периферийные устройства, глобальные сети, связана с появлением и развитием именно этой техники.

Большие компьютеры и суперкомпьютеры, конечно же, продолжают развиваться. Но теперь они уже не доминируют в компьютерном мире, как было раньше.

Некоторые характеристики вычислительной техники четырех поколений приведены в табл. 2.1.

19

 

 

 

 

Таблица 2.1

Характеристика

 

Положение

 

 

первое

второе

третье

четвёртое

 

 

 

Основной

Электронная

Транзистор

Интегральная

Большая

 

элемент

лампа

 

схема

интегральная

 

 

 

 

 

схема

 

Количество ЭВМ

Сотни

Тысячи

Десятки тысяч

Миллионы

 

в мире, шт.

 

 

 

 

 

Размер ЭВМ

Большой

Значительно

Десятки тысяч

Микро ЭВМ

 

 

 

меньший

 

 

 

Быстродействие

Несколько

Несколько

Несколько

Несколько

 

(условное)

единиц

десятков единиц

тысяч единиц

десятков тысяч

 

операций/с

 

 

 

единиц

 

Носитель

Перфокарта,

Магнитная

Диск

Гибкий диск

 

информации

перфолента

лента

 

 

 

Пятое поколение (1985 – 1990).

Кратко основную концепцию ЭВМ пятого поколения можно сформулировать следующим образом:

компьютеры на сверхсложных микропроцессорах с параллельно- векторной структурой, одновременно выполняющих десятки последовательных инструкций программы.

компьютеры с многими сотнями параллельно работающих процессоров, позволяющих строить системы обработки данных и знаний, эффективные сетевые компьютерные системы.

Шестое и последующие поколения ЭВМ

Электронные и оптоэлектронные компьютеры с массовым параллелизмом, нейронной структурой, с распределенной сетью большого числа (десятки тысяч) микропроцессоров, моделирующих архитектуру нейронных биологических систем.

20