Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛЕКЦИЯ 2-3.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
189.18 Кб
Скачать

Кодирование текстовых данных

Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования. Институт стандартизации США ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена США).

В системе ASCII закреплены две таблицы кодирования — базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

В России кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне» — компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение.

Если кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной — UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов — этого поля достаточно для размещения в одной таблице символов большинства языков планеты.

Кодирование графических данных

Растр — это метод кодирования графической информации, издавна принятый в полиграфии. Общепринятым на сегодняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и, таким образом, для кодирования яркости любой точки обычно достаточно восьмиразрядного двоичного числа.

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие.

Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).

Разбив «обычный» рисунок на квадратики, мы выполнили его дискретизацию – разбили единый объект на отдельные элементы.

Двоичный код для черно-белого рисунка, полученного в результате дискретизации можно построить следующим образом:

заменяем белые пиксели нулями, а черные – единицами;

выписываем строки полученной таблицы одну за другой.

Ширина этого рисунка – 8 пикселей, поэтому каждая строчка таблицы состоит из 8 двоичных разрядов – бит. Чтобы не писать очень длинную цепочку нулей и единиц, удобно использовать шестнадцатеричную систему счисления, закодировав 4 соседних бита (тетраду) одной шестнадцатеричной цифрой. Например, для первой строки получаем код 1A16:

А для всего рисунка: 1A2642FF425A5A7E16.

Кодирование звуковой информации

Метод FM {Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, а следовательно, может быть описан числовыми параметрами, то есть кодом.

Метод таблично-волнового представления (Wave-Table). В заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука.

Частота дискретизации определяет количество отсчетов, запоминаемых за 1 секунду;

1 Гц (один герц) – это один отсчет в секунду, а 16 кГц – это 16000 отсчетов в секунду.

Глубина кодирования – это количество бит, которые выделяются на один отсчет.

Для хранения информации о звуке длительностью t секунд, закодированном с частотой дискретизации v Гц и глубиной кодирования B бит требуется

B * v * t бит памяти;

например, при 2 кГц, глубине кодирования 8 бит на отсчёт и длительности звука 60 секунд требуется

I = 2 000 * 8 * 60 = 960 000 бит

I= 960 000 / 8 = 120 000 байт

I =120 000 / 1024 = 117, 2 Кбайт