Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие по информатике

.pdf
Скачиваний:
145
Добавлен:
21.03.2015
Размер:
2.03 Mб
Скачать

7. Классификация данных

Данные – это сведения, характеризующие некоторую систему, явление, процесс или объект, представленные в определенной форме и предназначенные для дальнейшего использования.

Данные выступают в качестве формы представления содержания информации (набор числовых значений, график, текстовое описание и др.)

ииспользуются для решения конкретных задач, т. е. имеют высокую прагматическую значимость.

Классификационные ризнаки

Тип данных определяет: набор допустимых значений; правила их обработки (преобразования); порядок их размещения в памяти компьютера при хранении; порядок доступа к ним.

По своей структуре данные могут быть:

Элементарные – символьные, числовые, логические данные. Структурированные – информационные массивы, объединяющие

данные и связи (отношения) между ними. Перечень объединяемых одиночных данных, их характеристики, а также особенности связей между ними образуют структуру данных.

Как элементарные, так и структурированные данные имеют значение

иимя (идентификатор). Значение – содержимое тех ячеек памяти, где данное располагается. Идентификатор – обозначение данного в тексте.

По возможности изменения значений данных Переменные – могут изменять значения по ходу исполнения

программы; Постоянные (константы) – имеют неизменяемое значение.

По этапу обработки использования

Исходные (входные) – необходимы для исполнения программы и вводимые в нее до или в процессе работы. Исходные данные могут быть записаны на внешнем носителе и вводиться с него, поступать по линиям связи от каких-либо датчиков или других компьютеров, вводится пользователем.

Промежуточные – формируются в ходе исполнения программы, обычно недоступны пользователю, существуют лишь в оперативной памяти компьютера.

Выходные – являются результатом работы программы, предназначены для пользователя, и представляются в требуемой для него форме.

8. Представление элементарных данных

Для представления значений элементарных данных в памяти компьютера используется машинное слово. Машинное слово – количество информации, записываемое или извлекаемое из памяти за одно обращение.

Машинное слово объединяет запоминающие элементы, служащие для записи 1 бита информации, в единую ячейку памяти. Количество

21

объединяемых элементов кратно 8, т. е. целому числу байт. Доступ к машинному слову в операциях записи и считывания осуществляется по номеру ячейки памяти, который называется адресом ячейки.

Запоминающие устройства, в которых доступ к данным осуществляется по адресу ячейки, где они хранятся, называются памятью с произвольным доступом (RAM – random access memory), в русской литературе это устройство носит название оперативной памяти.

Значения элементарных данных формируются в ходе исполнения программы и имеют физическое представление в оперативной памяти. Идентификаторы существуют только на уровне логического представления и используются для обозначения данных в тексте программы, а при трансляции программы с языка программирования в машинный код имена заменяются номерами ячеек, в которых данные размещаются.

Основными информационными единицами при сохранении данных на внешних носителях являются: логическая запись; физическая запись; файл; каталог (папка).

Ло ическая за ись – поименованная совокупность элементарных данных, имеющая смысловую завершенность. При хранении на внешних носителях логическая запись представляется в виде информационной единицы и является минимальным и неделимым элементом представления данных. Характеристикой записи является – длина записи, допустимая операция – перенос на носитель и считывание из него.

После размещения на носителе, данные превращаются в физическую запись.

Физическая запись – элемент поверхности носителя, на котором в соответствии с физическими принципами функционирования носителя размещаются данные, составляющие логическую запись.

Объединение физических записей образуют файл.

Файл – определенным образом оформленная совокупность физических записей, рассматриваемая как единое целое и имеющая описание в системе хранения информации.

Катало (директория, папка) – это специальное поименованная область диска, в которой хранятся имена файлов, сведения о размере файлов, времени их последнего обновления и т. д.

Файловая система – это часть операционной системы компьютера, которая создает и поддерживает файловые структуры, определяет максимальный уровень вложенности каталогов, а также производит все операции с файлами и каталогами.

9. Представление чисел в компьютере

Целые числа могут представляться в компьютере со знаком или без знака.

22

Целые числа без знака

Обычно занимают в памяти компьютера один или два байта.

Воднобайтовом формате принимают значения от 000000002 до 111111112.

Вдвубайтовом формате – от 00000000000000002 до 11111111111111112.

Диа азоны значений целых чисел без знака

Формат числа в

Диапазон

байтах

Запись с порядком

Обычная запись

1

0 ... 28 - 1

0 ... 255

2

0 ... 216 - 1

0 ... 65535

Целые числа со знаком

Обычно занимают в памяти компьютера один, два или четыре байта, при этом самый левый (старший) разряд содержит информацию о знаке числа.

Диа азоны значений целых чисел со знаком

Формат числа

 

Диапазон

 

в байтах

Запись с порядком

 

Обычная запись

1

–27

... 27–1

 

–128 ... 127

2

–215

... 215–1

 

–32768 ... 32767

4

–231

... 231–1

 

–2147483648 ...

 

 

 

 

2147483647

Рассмотрим особенности записи целых чисел со знаком на примере однобайтового формата, при котором для знака отводится один разряд, а для цифр абсолютной величины – семь разрядов.

Вкомпьютерной технике применяются три формы записи

(кодирования) целых чисел со знаком: рямой код, обратный код,

до олнительный код.

Последние две формы применяются особенно широко, так как позволяют упростить конструкцию арифметико-логического устройства компьютера путем замены разнообразных арифметических операций операцией сложения.

Положительные числа в прямом, обратном и дополнительном кодах изображаются одинаково – двоичными кодами с цифрой 0 в знаковом разряде. Например:

Отрицательные числа в прямом, обратном и дополнительном кодах имеют разное изображение.

Прямой код. В знаковый разряд помещается цифра 1, а в разряды цифровой части числа — двоичный код его абсолютной величины. Например:

23

Обратный код. Получается инвертированием всех цифр двоичного кода абсолютной величины числа, включая разряд знака: нули заменяются единицами, а единицы — нулями. Например:

До олнительный код. Получается образованием обратного кода с последующим прибавлением единицы к его младшему разряду. Например:

Обычно отрицательные десятичные числа при вводе в машину автоматически преобразуются в обратный или дополнительный двоичный код и в таком виде хранятся, перемещаются и участвуют в операциях. При выводе таких чисел из машины происходит обратное преобразование в отрицательные десятичные числа.

Вещественные числа

Система вещественных чисел в математических вычислениях предполагается непрерывной и бесконечной, т.е. не имеющей ограничений на диапазон и точность представления чисел. Однако в компьютерах числа хранятся в регистрах и ячейках памяти с ограниченным количеством разрядов. Вследствие этого система вещественных чисел, представимых в машине, является дискретной (прерывной) и конечной.

При написании вещественных чисел в программах вместо привычной запятой принято ставить точку. Для отображения вещественных чисел, которые могут быть как очень маленькими, так и очень большими, используется форма записи чисел с порядком основания системы счисления. Например, десятичное число 1.25 в этой форме можно представить так:

1.25 ∙ 100 = 0.125 ∙ 101 = 0.0125 ∙ 102 = ...

или так:

12.5 ∙ 10-1 = 125.0 ∙ 10-2 = 1250.0 ∙ 10-3 = ...

Любое число N в системе счисления с основанием q можно записать

в виде

N=M∙qp,

где M – множитель, содержащий все цифры числа (мантисса), а p – целое число, называемое орядком. Такой способ записи чисел называется представлением числа с плавающей точкой.

Если «плавающая» точка расположена в мантиссе перед первой значащей цифрой, то при фиксированном количестве разрядов, отведённых под мантиссу, обеспечивается запись максимального

24

количества значащих цифр числа, то есть максимальная точность представления числа в машине. Из этого следует:

Мантисса должна быть правильной дробью, у которой первая цифра после точки (запятой в обычной записи) отлична от нуля: 0.12 <= |M| < 1. Если это требование выполнено, то число называется нормализованным.

Мантиссу и порядок q-ичного числа принято записывать в системе с основанием q, а само основание – в десятичной системе. Примеры

нормализованного представления:

 

Десятичная система

Двоичная система

753.15 = 0.75315 ∙ 103

–101.01 = –0.10101 ∙ 211 (порядок

 

112 = 310)

–0.000034 = –0.34 ∙ 10-4

0.000011 = 0.11 ∙ 2-100 (порядок –1002 =

 

–410)

Вещественные числа в компьютерах различных типов записываются по-разному, тем не менее, все компьютеры поддерживают несколько международных стандартных форматов, различающихся по точности, но имеющих одинаковую структуру следующего вида:

Здесь порядок n-разрядного нормализованного числа задается в так называемой смещенной форме: если для задания порядка выделено k разрядов, то к истинному значению порядка, представленного в дополнительном коде, прибавляют смещение, равное (2k-1 –1). Например, порядок, принимающий значения в диапазоне от –128 до +127, представляется смещенным порядком, значения которого меняются от 0 до 255.

Использование смещенной формы позволяет производить операции над порядками, как над беззнаковыми числами, что упрощает операции сравнения, сложения и вычитания порядков, а также упрощает операцию сравнения самих нормализованных чисел.

Чем больше разрядов отводится под запись мантиссы, тем выше точность представления числа. Чем больше разрядов занимает порядок, тем шире диапазон от наименьшего отличного от нуля числа до наибольшего числа, представимого в машине при заданном формате.

Стандартные форматы представления вещественных чисел:

-одинарный – 32-разрядное нормализованное число со знаком, 8-разрядным смещенным порядком и 24-разрядной мантиссой (старший бит мантиссы, всегда равный 1, не хранится в памяти, и размер поля, выделенного для хранения мантиссы, составляет только 23 разряда).

25

-двойной – 64-разрядное нормализованное число со знаком, 11-разрядным смещенным порядком и 53-разрядной мантиссой (старший бит мантиссы не хранится, размер поля, выделенного для хранения мантиссы, составляет 52 разряда).

-расширенный – 80-разрядное число со знаком, 15-разрядным смещенным порядком и 64-разрядной мантиссой. Позволяет хранить ненормализованные числа.

Следует отметить, что вещественный формат с m-разрядной мантиссой позволяет абсолютно точно представлять m-разрядные целые числа, т. е. любое двоичное целое число, содержащее не более m разрядов, может быть без искажений преобразовано в вещественный формат.

10. Кодирование текстовой информации

Тексты – это последовательности символов, входящих в некоторый алфавит. Кодирование текста сводится к двоичному кодированию алфавита, на основе которого он построен. Чаще всего применяется байтовое кодирование алфавита.

В этом случае максимальная мощность алфавита составляет 256 символов. Такой алфавит может содержать два набора буквенных символов (например, русский и латинский), цифры, знаки препинания и математические знаки, пробел и небольшое число дополнительных символов.

Однако имеются определенные проблемы, носящие исторический и организационный характер. Международным стандартом является система ASCII, закрепляющая значения кодов от 0 до 127. В этой области размещаются коды символов латинского алфавита, цифры и большинство стандартных знаков препинании и математических операций.

Для кодировок национальных символов отводятся коды от 128 до 255. Для русского языка существует несколько стандартных кодировок, изза чего часто требуется дополнительное преобразование данных.

Ограниченный набор из 256 кодов символов сегодня уже не удовлетворяет возросшие потребности международного общения. Поэтому стала использоваться универсальная система 16-разрядного кодирования символов UNICODE.

Мощность алфавита в системе кодирования составляет 216 = 65536 разных кодов, из которых 63 484 кода соответствуют символам большинства алфавитов, используемых народами Земли, а оставшиеся 2048 кодов разделены пополам и образуют таблицу размером 1024 столбцов на 1024 строк. В этой таблице более миллиона ячеек, в которых можно разместить еще более миллиона различных символов. Это символы «мертвых» языков, a также символы, не имеющие лексического содержания, указатели, знаки и т. п. Для записи этих дополнительных символов необходима пара 16-разрядных слов (16 разрядов для номера строки и 16 разрядов для номера столбца).

26

Таким образом, система UNICODE является универсальной системой кодирования всех символов национальных письменных систем и обладает возможностью существенного расширения.

Переход к повсеместному использованию системы UNICODE носит постепенный характер. Его сдерживает существующая документная база и необходимость в высоком уровне развития вычислительной техники.

11. Кодирование графической информации

Система кодирования RGB (Red-Green-Blue – красный-зеленый- синий). Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие: красный, зеленый и синий. На практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех основных цветов.

Режим представления цветной графики с использованием 24 двоичных разрядов называют полноцветным (True Color). При этом система кодирования обеспечивает однозначное определение 16,5 млн. различных цветов, что близко к чувствительности человеческого глаза.

CMYK (Cyan-Magenta-Yellow – голубой-пурпурный-желтый) –

цветовая система, применяемая для получения цветных изображений на белой поверхности. При освещении каждый из трех основных цветов поглощает дополняющий его цвет: голубой цвет поглощает красный, пурпурный – зеленый, а желтый – синий. Новые цвета в системе CMY получают вычитанием цветовых составляющих из белого цвета. Они имеют длину волны отраженного света, не поглощенного основными цветами CMY.

Растровый метод. Рисующий инструмент, способный оставлять видимый след, сканирует всю поверхность, на которую выводится изображение. Траектория движения инструмента постоянна и не зависит от выводимого изображения, но инструмент может рисовать или не рисовать отдельные точки траектории. Видимым изображением являются оставленные точки. Растровое изображение хранится с помощью точек различного цвета (пикселей), которые образуют матрицу. Каждый пиксель имеет определенное положение и цвет. Качество растрового изображения зависит от размера изображения (количества пикселей по горизонтали и вертикали) и количества цветов, которое можно задать для каждого пикселя. Растровые изображения чувствительны к масштабированию. Видеомонитор является растровым устройством вывода динамически изменяемых изображений. Луч сканирует экран с частотой, которая не должна позволять глазу видеть мерцание изображения. Принтеры, планшетные и рулонные плоттеры – растровые устройства вывода статического изображения.

При векторном методе рисующий инструмент прорисовывает изображаемые фигуры, и его траектория движения определяется

27

выводимым изображением, которое состоит из графических примитивов (отрезки, векторы, дуги, окружности). Векторные графические изображения являются оптимальным средством хранения высокоточных графических объектов (чертежи, схемы и т. д.), для которых имеет значение сохранение четких и ясных контуров. Уменьшение и увеличение изображения происходит без потери качества. К векторным устройствам можно отнести перьевые плоттеры, был разработан векторный монитор, но из-за сложности конструкции, не пользуется популярностью. Диджитайзеры – векторные устройства ввода. Плоттеры – векторные устройства по входным данным.

Векторные методы позволяют избежать проблем масштабирования, характерных для растровых методов. В этом случае изображение представляется в виде совокупности линий и кривых. Вместо того чтобы заставлять устройство воспроизводить заданную конфигурацию пикселей, составляющих изображение, ему передается подробное описание того, как расположены образующие изображение линии и кривые. На основе этих данных устройство создает готовое изображение. С помощью подобной технологии описываются различные шрифты, поддерживаемые современными принтерами и мониторами. Они позволяют изменять размер символов в широких пределах и по этой причине получили название масштабируемых шрифтов. Например, технология True Type, разработанная компаниями Microsoft и Apple Computer, описывает способ отображения символов в тексте.

12. Кодирование звуковой информации

Для оцифровки звука используется преобразование аналогового сигнала в цифровой сигнал.

Преобразование звуковых волн в двоичный код в памяти компьютера:

Звуковая волна микрофон переменный электрический ток аудиоадаптер двоичный код память ЭВМ.

Воспроизведение звуковой информации, сохраненной в памяти компьютера:

Память ЭВМ двоичный код аудиоадаптер электрический сигналакустическая система звуковая волна.

Перевод сигнала из аналоговой формы в цифровую (дискретную) означает замену описывающей его непрерывной функции Z(t) на некотором отрезке [t1;t2] конечным множеством {Zi;ti}, где i = 0 … n, n – количество точек разбиения временного интервала. Преобразование называется дискретизацией непрерывного сигнала и осуществляется посредством двух операций:

развертка по времени – наблюдение за значением величины Z производится в определенные моменты времени с интервалом t.

28

квантование по величине сигнала – отображение вещественных значений параметра сигнала в конечное множество чисел, кратных некоторой постоянной величине – шагу квантования Z.

Совместное выполнение обеих операций эквивалентно нанесению масштабной сетки на график Z(t). В качестве пар значений {Zi;ti} выбираются узлы сетки, расположенные наиболее близко к графику. Полученное множество узлов является дискретным представлением исходной непрерывной функции (рис. 1).

Рис. 1. Дискретное редставление не рерывной функции

Число уровней квантования сигнала, представленного на рисунке равно 6. Можно провести нумерацию уровней и выразить их в двоичной системе счисления. Для шести уровней достаточно трех двоичных разрядов. Каждое дискретное значение представляется в этом случае двоичным кодом в виде последовательности сигналов двух уровней.

Значение

код

Значение

код

Значение

код

№ уровня

Значение

код

уровня

уровня

 

уровня

уровня

 

уровня

уровня

 

 

уровня

 

1

4

100

4

5

101

7

3

011

10

2

010

2

5

101

5

4

100

8

2

010

11

3

011

3

5

101

6

3

011

9

2

010

12

3

011

Рис. 2. Числовое редставление звуково о си нала

Полученные числовые коды хорошо фильтруются, легко обрабатываются и высоконадежны.

29

Контрольные вопросы по теме 2

1.Перечислите меры информации синтаксического уровня.

2.Что такое энтропия?

3.Какие существуют единицы измерения информации?

4.Что больше 1 байт или 1 бит?

5.Сколько байт в 1 Кбайте?

6.Что определяет семантический аспект информации?

7.Чем определяется семантическая мера количества информации

8.С какой системой счисления работает компьютер?

9.Чему равно минимальное количество байт для двоичного кодирования числа 25710?

10.Чему равно максимальное неотрицательное целое число, кодируемое одним байтом?

11.Каким числом представляется сумма чисел 16 + 4 + 1 в двоичной системе счисления?

12.Чему будет равно записанное в двоичной системе счисления

число 110011,112 в десятичной системе (с точностью до двух знаков после запятой)?

13.Чему равно максимальное шестнадцатеричное число, кодируемое одним байтом?

14.

Чему

равна последняя цифра

суммы чисел

548 и 568

 

в восьмеричной системе счисления?

 

15.

От

чего зависит количество

информации,

содержащееся

в некотором сообщении?

16.В чем отличие векторного метода от растрового?

17.Что такое RGB?

ТЕМА 3. ЛОГИЧЕСКИЕ ОСНОВЫ ЭВМ

1. Логика высказываний

Ло ическое высказывание – это любое повествовательное пpедлoжение, в oтнoшении кoтopoгo можно oднoзначнo сказать, истинно oнo или лoжнo.

Так, например, предложение «6 – четное число» следует считать высказыванием, так как оно истинное. Предложение «Рим – столица Франции» тоже высказывание, так как оно ложное.

Не всякое предложение является логическим высказыванием. Высказываниями не являются, например, предложения «студент первого курса» и «информатика – интересный предмет». Вопросительные и восклицательные предложения также не являются высказываниями, поскольку говорить об их истинности или ложности не имеет смысла.

Предложения типа «в городе A более миллиона жителей», «у него голубые глаза» не являются высказываниями, так как для выяснения их

30