Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика_учебное пособие, Тумбаева, Фатеева....docx
Скачиваний:
0
Добавлен:
10.02.2020
Размер:
1 Mб
Скачать

Алфавитный подход к определению количества информации

В алфавитном подходе к определению количества информации вычисляют информационную емкость символов в тексте (объем текста).

Мощность (размер) алфавита N равна количеству символов (буквы, цифры, знаки) в алфавите. Пробелы, знаки препинания считаются во фразе как отдельные символы.

Количество информации одного символа Х вычисляется по формуле:

X = log2N, (3)

так как 2Х = N.

Количество информации ХК во фразе, где К – количество символов:

ХК = X × K. (4)

Пример. Мощность русского алфавита составляет 87 символов, так как

N = 33 строчные буквы + 33 прописные буквы + 21 специальный знак.

Пример. Вычислите количество информации в предложении «Я знаю информатику на отлично.»

Решение. Мощность алфавита N = 87, тогда Х = log287 = 6,4 бит (по формуле (3)), количество символов во фразе К = 30. Хк = 6,4 × 30 = 192 бита (по формуле (4)). Ответ: 192 бита.

    1. Кодирование текстовой информации

Кодирование текста – это соответствие между символами и их номерами в специальной таблице. Каждый символ кодируется определенным числом, которое называется кодом символа. Значения кодов символов хранятся в специальных таблицах, называемых кодовыми таблицами. В настоящее время существует несколько широко распространенных схем кодирования: КОИ-7 – семибитная кодировка; ANSI, ASCII, КОИ-8R и CP1251 – 8-битные кодировки; Unicode, UTF-16 – 16-битные кодировки.

ANSI (American National Standards Institute – Американский национальный институт стандартов) – кодировка символов 8-разрядными двоичными числами в Windows. Обеспечивается представление 256 символов.

Кодировка Code Page1251, CP1251 Windows-1251 или Windows Cyrilic разработана компанией Microsoft для поддержки русского языка в системе Windows (на один символ отводится 8 бит).

Пример. Вычислите количество информации во фразе «Я знаю информатику на отлично.», при кодировке 8-разрядными числами.

Решение: Х = 8 бит, т.к. кодировка 8-разрядными числами. Количество символов в фразе К = 30, тогда Хк= 8 × 30 = 240 бит (по формуле (4)).

Ответ: 240 бит.

Пример. Книга содержит 100 страниц, на каждой странице – 35 строк, в каждой строке – 50 символов. Найти объем информации, содержащейся в книге (принять однобайтный код символов).

Решение: книга содержит 35 × 50 ×100 = 175000 байт информации.

Ответ: 175000 байт.

Unicode – кодировка символов 16-разрядными двоичными числами, в результате использования которой удается представить 65536 различных знаков, что достаточно для одновременного представления всех букв основных языков и всевозможных буквенных символов. В более компактных ANSI и ASCII-кодировках могут одновременно представляться буквы только двух алфавитов – например, латинского и русского. Кодировку Unicode имеют шрифты, имена папок и файлов.

    1. Кодирование графической информации Векторные и растровые изображения

Растровые графические изображения формируются в процессе преобразования графической информации из аналоговой формы в цифровую, например, в процессе сканирования существующих на бумаге или фотопленке рисунков и фотографий, при использовании цифровых фото- и видеокамер, при просмотре на компьютере телевизионных передач с использованием ТВ-тюнера и т. д. Можно создать растровое графическое изображение непосредственно на компьютере с использованием графического редактора.

Растровое изображение хранится с помощью точек различного цвета (пикселей), расположенных в виде прямоугольной сетки – растра. Пи́ксель (pixel – элемент изображения) – наименьший логический элемент двумерного цифрового изображения в растровой графике. Пиксель представляет собой неделимый объект в основном прямоугольной или круглой формы, имеющий определенный цвет. Каждый пиксель кодируется положением и цветом.

Пикселем также называют элементы светочувствительной матрицы и матрицы дисплеев. Количество пикселей, из которых состоит матрица экрана, называется разрешением. Чем выше разрешение дисплея, тем лучше качество изображения. Разрешающие способности экранов: 1024 × 768, 1280 × 1024 и другие.

Растровые изображения чувствительны к масштабированию. При уменьшении растрового изображения несколько соседних пикселей преобразуются в один, поэтому теряются мелкие детали изображения. При увеличении изображения увеличивается размер каждого пикселя и появляется лестничный эффект.

Размер растрового файла пропорционален размеру изображения. Объем растрового изображения вычисляется как произведение значения глубины цвета на количество пикселей. С целью изменения объема файла применяют сжатие или компрессию (от лат. compressio – сжатие), т.е. преобразование данных. Сжатие может происходить с потерями или без потерь (данные можно полностью восстановить).

Векторное изображение кодируется с помощью формул и координат. Векторные изображения формируются из объектов – примитивов (точка, линия, окружность, прямоугольник и пр.). Для каждого примитива задается формула и цвет. Достоинства векторной графики: файлы небольшого объема; векторные изображения можно масштабировать без потери четкости и деталей.

Преобразование векторного изображения в пиксельное называется растрированием или рендерингом. Преобразование пиксельного изображения в векторное – векторизация или трассировка. Форматы графических файлов представлены в приложении 2.