Алфавитный подход к определению количества информации

В алфавитном подходе к определению количества информации вычисляют информационную емкость символов в тексте (объем текста).

Мощность (размер) алфавита N равна количеству символов (буквы, цифры, знаки) в алфавите. Пробелы, знаки препинания считаются во фразе как отдельные символы.

Количество информации одного символа Х вычисляется по формуле:

X = log₂N, (3)

так как 2^Х = N.

Количество информации Х_Кво фразе, где К – количество символов:

Х_К = X × K. (4)

Пример. Мощность русского алфавита составляет 87 символов, так как

N = 33 строчные буквы + 33 прописные буквы + 21 специальный знак.

Пример. Вычислите количество информации в предложении «Я знаю информатику на отлично.»

Решение. Мощность алфавита N = 87, тогда Х = log₂87 = 6,4 бит (по формуле (3)), количество символов во фразе К = 30. Х_к = 6,4 × 30 = 192 бита (по формуле (4)). Ответ: 192 бита.

Кодирование текстовой информации

Кодирование текста – это соответствие между символами и их номерами в специальной таблице. Каждый символ кодируется определенным числом, которое называется кодом символа. Значения кодов символов хранятся в специальных таблицах, называемых кодовыми таблицами. В настоящее время существует несколько широко распространенных схем кодирования: КОИ-7 – семибитная кодировка; ANSI, ASCII, КОИ-8R и CP1251 – 8-битные кодировки; Unicode, UTF-16 – 16-битные кодировки.

ANSI (American National Standards Institute – Американский национальный институт стандартов) – кодировка символов 8-разрядными двоичными числами в Windows. Обеспечивается представление 256 символов.

Кодировка Code Page1251, CP1251 Windows-1251 или Windows Cyrilic разработана компанией Microsoft для поддержки русского языка в системе Windows (на один символ отводится 8 бит).

Пример. Вычислите количество информации во фразе «Я знаю информатику на отлично.», при кодировке 8-разрядными числами.

Решение: Х = 8 бит, т.к. кодировка 8-разрядными числами. Количество символов в фразе К = 30, тогда Х_к= 8 × 30 = 240 бит (по формуле (4)).

Ответ: 240 бит.

Пример. Книга содержит 100 страниц, на каждой странице – 35 строк, в каждой строке – 50 символов. Найти объем информации, содержащейся в книге (принять однобайтный код символов).

Решение: книга содержит 35 × 50 ×100 = 175000 байт информации.

Ответ: 175000 байт.

Unicode – кодировка символов 16-разрядными двоичными числами, в результате использования которой удается представить 65536 различных знаков, что достаточно для одновременного представления всех букв основных языков и всевозможных буквенных символов. В более компактных ANSI и ASCII-кодировках могут одновременно представляться буквы только двух алфавитов – например, латинского и русского. Кодировку Unicode имеют шрифты, имена папок и файлов.

Кодирование графической информации Векторные и растровые изображения

Растровые графические изображения формируются в процессе преобразования графической информации из аналоговой формы в цифровую, например, в процессе сканирования существующих на бумаге или фотопленке рисунков и фотографий, при использовании цифровых фото- и видеокамер, при просмотре на компьютере телевизионных передач с использованием ТВ-тюнера и т. д. Можно создать растровое графическое изображение непосредственно на компьютере с использованием графического редактора.

Растровое изображение хранится с помощью точек различного цвета (пикселей), расположенных в виде прямоугольной сетки – растра. Пи́ксель (pixel – элемент изображения) – наименьший логический элемент двумерного цифрового изображения в растровой графике. Пиксель представляет собой неделимый объект в основном прямоугольной или круглой формы, имеющий определенный цвет. Каждый пиксель кодируется положением и цветом.

Пикселем также называют элементы светочувствительной матрицы и матрицы дисплеев. Количество пикселей, из которых состоит матрица экрана, называется разрешением. Чем выше разрешение дисплея, тем лучше качество изображения. Разрешающие способности экранов: 1024 × 768, 1280 × 1024 и другие.

Растровые изображения чувствительны к масштабированию. При уменьшении растрового изображения несколько соседних пикселей преобразуются в один, поэтому теряются мелкие детали изображения. При увеличении изображения увеличивается размер каждого пикселя и появляется лестничный эффект.

Размер растрового файла пропорционален размеру изображения. Объем растрового изображения вычисляется как произведение значения глубины цвета на количество пикселей. С целью изменения объема файла применяют сжатие или компрессию (от лат. compressio – сжатие), т.е. преобразование данных. Сжатие может происходить с потерями или без потерь (данные можно полностью восстановить).

Векторное изображение кодируется с помощью формул и координат. Векторные изображения формируются из объектов – примитивов (точка, линия, окружность, прямоугольник и пр.). Для каждого примитива задается формула и цвет. Достоинства векторной графики: файлы небольшого объема; векторные изображения можно масштабировать без потери четкости и деталей.

Преобразование векторного изображения в пиксельное называется растрированием или рендерингом. Преобразование пиксельного изображения в векторное – векторизация или трассировка. Форматы графических файлов представлены в приложении 2.

<<< < Предыдущая 1 2 3 4 5 6 78 / 438 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.2025557.06 Кб2Инвестиции к печати.doc
#
21.11.2019378.37 Кб13Инд. раб. Колбасный цех нов.doc
#
19.03.2016140.01 Кб21ИНДИВИДУАЛЬНЫЙ ДОГОВОР на практику 2016.pdf
#
01.09.2019744.45 Кб9Интегрированная защита осины от Ивовой Волнянки...doc
#
01.09.2019652.8 Кб16Интегрированная защита Сосны обыкновенной От Со...doc
#
01.05.20251 Mб4Информатика_учебное пособие, Тумбаева, Фатеева....docx
#
19.03.2016918.02 Кб152История Зачет.doc
#
12.11.201957.49 Кб13История Зем.отношений 1 лекция.docx
#
19.03.20161.27 Mб133ИСТОРИЯ.doc
#
01.05.2025579.07 Кб9ИТАИ ин яз.doc
#
01.05.2025289.28 Кб0Итоговый тест.Окружающий мир..doc

Алфавитный подход к определению количества информации

Кодирование текстовой информации

Кодирование графической информации Векторные и растровые изображения